#interacción

Estabilidad vs. Manipulabilidad: Robustez en Jueces de IA

¿Son confiables los jueces de IA? Este estudio revela que aunque estables, pueden revertirse con desafíos posteriores, afectando rankings y preferencias humanas.

2026-06-06 · 3 min

Estabilidad vs. Manipulabilidad: Evaluando Robustez en Jueces LLM

Los jueces LLM son estables en reevaluaciones neutrales, pero vulnerables a retos dirigidos. El ERS mide su robustez interaccional. Conoce sus implicaciones.

2026-06-06 · 2 min

Memoria reconstruida, no recuperada: Memoria gráfica para agentes LLM

Descubre cómo MRAgent revoluciona la memoria de agentes LLM con un grafo asociativo y reconstrucción activa, mejorando el razonamiento en interacciones largas.

2026-06-06 · 2 min

Sistemas auto-evolutivos: el rol de la interacción humano-agente

Descubre cómo el marco ANCHOR utiliza supervisión humana para estabilizar agentes auto-evolutivos, previniendo degradación sin afectar rendimiento.

2026-06-06 · 3 min

ALMANAC: Dataset de modelos mentales para colaboración de agentes

Descubre ALMANAC, el primer dataset con anotaciones de modelos mentales para mejorar la colaboración entre humanos y agentes de IA. ¡Mejora tus agentes ahora!

2026-06-06 · 2 min

Modelo de persuasión humana multi-turno con trazado de creencias

Descubre cómo PERSUASIONTRACE modela la persuasión humana en diálogos multi-turno con IA, evaluando dinámicas de creencias y fidelidad de simulaciones.

2026-06-06 · 2 min

Modelo de persuasión multironda con rastreo probabilístico de creencias

Descubre PERSUASIONTRACE, un marco para analizar cómo los LLM persuaden en diálogos multironda. Un modelo bayesiano de rastreo de creencias revela la dinámica de la persuasión.

2026-06-06 · 2 min

El rol de la guía instruccional en el aprendizaje asistido por IA generativa

Descubre cómo una guía instruccional de cinco pasos mejora el rendimiento en tareas de razonamiento con IA generativa. Estudio controlado en ingeniería.

2026-06-06 · 3 min

Aprovechando el contexto estructural para la alineación de entidades

ContextEA mejora la alineación de entidades en grafos de conocimiento aprovechando el contexto estructural. Resultados superiores.

2026-06-06 · 2 min

Partición causal preregistrada de elicitación y diseño de recompensas en RLVR

Investigación revela que el estimador ingenuo en RLVR mezcla elicitación y diseño de recompensas. Un nuevo método de partición causal permite auditar resultados.

2026-06-05 · 2 min

Adaptación zero-shot y one-shot de SLMs en interacción líder-seguidor

SLMs ajustados con zero-shot logran 86.66% de precisión en roles líder-seguidor, superando a prompts. Ideal para computación edge.

2026-06-04 · 1 min

ZeroWBC: Interacción humanoide natural desde datos egocéntricos

Descubre cómo ZeroWBC permite a humanoides interactuar de forma natural sin teleoperación, aprendiendo de videos egocéntricos.

2026-06-04 · 2 min

Aprendizaje por refuerzo superior con interacción humano-IA

Descubre cómo la interacción humano-IA crea una super-política que supera al aprendizaje por refuerzo tradicional, incluso con confusión.

2026-06-04 · 2 min

ContactExplorer: Exploración con cobertura de contacto para manipulación diestra

Descubre ContactExplorer, un método que usa cobertura de contacto para guiar la exploración en manipulación diestra, mejorando eficiencia y tasa de éxito en tareas complejas.

2026-06-04 · 2 min

Aprendiendo mientras actúan: co-evolución para agentes de aprendizaje continuo

Descubre LifeSkill, un marco de co-evolución que mejora habilidades en agentes de IA durante la inferencia. Aumenta un 7% el rendimiento en tareas largas.

2026-06-04 · 2 min

Clarificación consciente de incertidumbre en agentes LLM

Aumenta un 3.7% la eficacia de agentes LLM con clarificación inteligente. Solo 0.3 interacciones extra. Optimiza tareas y reduce errores.

2026-06-03 · 1 min

Trayectorias de interacción efectivas para entrenar agentes terminales

Descubre por qué los agentes de IA más débiles pueden ser mejores maestros. Las trayectorias guiadas por el entorno logran eficiencia de datos excepcional.

2026-06-03 · 3 min

Aprendizaje bayesiano disperso para núcleos de interacción Motsch-Tadmor

Aprende cómo un algoritmo SBL estima núcleos de interacción en el modelo Motsch-Tadmor, cuantificando incertidumbre a partir de datos de trayectoria.

2026-06-03 · 3 min

CoMPAS3D: Dataset y Benchmark para Movimiento Interactivo en Robótica Social

Descubre CoMPAS3D, el dataset de captura de movimiento de salsa que permite evaluar robots humanoides en interacciones sociales con métricas objetivas.

2026-06-03 · 2 min

Elicitación de Preferencias Causales

Descubre cómo la elicitación causal de preferencias acelera el descubrimiento causal con consultas activas a expertos. Un enfoque bayesiano para concentrar la posterior sobre DAGs.

2026-06-03 · 2 min