#interacción

¿Qué aprenden los estudiantes? Análisis de características en KD

Analizamos el aprendizaje de características en destilación de conocimiento y presentamos Confusion Distillation, una auto-destilación eficiente que supera a otros métodos en 1.2%.

2026-06-03 · 2 min

Multi²: Toma de Decisiones Multiagente Jerárquica con LLMs

Descubre cómo Multi², un marco jerárquico multiagente con LLMs, evita la deriva de objetivos y mejora la toma de decisiones en entornos interactivos. ¡Lee más!

2026-06-03 · 2 min

AVTrack: Seguimiento Audiovisual en Escenas Humanas Complejas

Conoce AVTrack, el dataset que desafía los métodos actuales de seguimiento audiovisual en escenas humanas complejas con oclusiones y movimiento.

2026-06-03 · 1 min

Fusión de trayectoria de mano para consultas NLQ egocéntricas

Mejora la precisión del grounding en videos egocéntricos con fusión de trayectorias de mano. Resultados en Ego4D: +4.32% en consultas de cantidad/estado.

2026-06-03 · 2 min

WebRISE: Evaluación de Estados por Requisitos en Artefactos Web MLLM

WebRISE: nuevo benchmark evalúa estados y transiciones en artefactos web generados por MLLM. La calidad visual no es suficiente. Descubre más.

2026-06-03 · 2 min

BotDirector: Narración de robots en realidad simétrica

Descubre cómo BotDirector combina robots, IA y objetos cotidianos para que los niños creen sus propias historias interactivas. ¡Una forma innovadora de contar cuentos!

2026-06-03 · 2 min

Aprendizaje eficiente de Hamiltonianos, estructura y traza de estados Gaussianos

Aprende sobre el nuevo protocolo para aprendizaje eficiente de Hamiltonianos de estados Gaussianos usando mediciones heterodinas e inversión local.

2026-06-02 · 2 min

¿Pueden los modelos de lenguaje visual aprender física intuitiva?

¿Pueden los modelos de lenguaje visual desarrollar intuiciones físicas mediante interacción? Un estudio revela que el aprendizaje por refuerzo no basta para generalizar reglas físicas.

2026-06-02 · 2 min

Avatar Forcing: Avatares interactivos en tiempo real para conversación natural

Descubre cómo Avatar Forcing permite generar avatares interactivos en tiempo real que reaccionan a tu voz y gestos, con baja latencia y sin etiquetado. ¡Más del 80% de preferencia!

2026-06-02 · 1 min

Seguridad Permisiva con Inferencia Confiable en Robótica Interactiva

Nuevo método certifica la seguridad de robots autónomos con filtros de creencia menos conservadores, usando predicción conforme para una interacción humano-robot más eficiente y segura.

2026-06-02 · 2 min

Actuar con IA: Marco de interacción para responsabilidad de agentes

Descubre cómo un nuevo marco basado en la interacción humano-IA asigna responsabilidad cuando la IA autónoma causa daños. Tres tipos de interacción clave.

2026-06-02 · 3 min

Inteligencia Centrada en la Interacción: nuevo enfoque para IA co-creativa

Descubre cómo la interacción se convierte en la unidad principal de análisis en la IA co-creativa, redefiniendo la inteligencia en sistemas humano-IA.

2026-06-02 · 2 min

Interacción de modalidades en MLLMs: descomposición parcial

Entiende cómo la PID descompone la interacción entre modalidades en MLLMs, identificando sinergia y redundancia. Clave para mejorar razonamiento y grounding en IA.

2026-06-02 · 2 min

Rastreando la alfabetización en GenAI: patrones estudiante-IA

Analítica del aprendizaje revela patrones distintos en interacción IA según nivel de alfabetización en GenAI. Estudio con 162 estudiantes.

2026-06-02 · 2 min

Aprendizaje independiente en estadística con LLM guiados

Descubre cómo el uso guiado de LLMs en estadística mejora el aprendizaje autónomo y la calibración del conocimiento, superando el simple acceso a la IA.

2026-06-02 · 2 min

Más allá de la boca: señales faciales superiores en reconocimiento audiovisual

Las señales del rostro superior mejoran el reconocimiento de frases bajo ruido. Un estudio revela su valor más allá de la boca en sistemas audiovisuales.

2026-06-02 · 2 min

Propagación adaptativa guiada por estructura para PPIS

Conoce el innovador modelo SGAP-PPIS que predice sitios de interacción proteína-proteína usando propagación adaptativa.

2026-06-02 · 1 min

Percepción del mundo por control: representaciones basadas en empoderamiento

Descubre cómo el empoderamiento aprende representaciones solo con lo relevante para el control, ignorando el ruido. Perspectiva causal desde la interacción.

2026-06-01 · 2 min

GSAM: Marco robótico seguro y generalizable para objetos articulados

Descubre GSAM, un marco robótico que mejora un 36% la tasa de éxito en manipulación de objetos articulados, reduciendo colisiones. ¡Lee más!

2026-06-01 · 2 min

SpatialAct: Probando el razonamiento-acción espacial de VLMs

Los VLMs son buenos en razonamiento espacial pero fallan en interacciones multiturno. SpatialAct revela la brecha entre percepción y acción en 3D.

2026-06-01 · 3 min