¿Qué aprenden los estudiantes? Análisis de características en KD
Analizamos el aprendizaje de características en destilación de conocimiento y presentamos Confusion Distillation, una auto-destilación eficiente que supera a otros métodos en 1.2%.
Analizamos el aprendizaje de características en destilación de conocimiento y presentamos Confusion Distillation, una auto-destilación eficiente que supera a otros métodos en 1.2%.
Descubre cómo Multi², un marco jerárquico multiagente con LLMs, evita la deriva de objetivos y mejora la toma de decisiones en entornos interactivos. ¡Lee más!
Conoce AVTrack, el dataset que desafía los métodos actuales de seguimiento audiovisual en escenas humanas complejas con oclusiones y movimiento.
Mejora la precisión del grounding en videos egocéntricos con fusión de trayectorias de mano. Resultados en Ego4D: +4.32% en consultas de cantidad/estado.
WebRISE: nuevo benchmark evalúa estados y transiciones en artefactos web generados por MLLM. La calidad visual no es suficiente. Descubre más.
Descubre cómo BotDirector combina robots, IA y objetos cotidianos para que los niños creen sus propias historias interactivas. ¡Una forma innovadora de contar cuentos!
Aprende sobre el nuevo protocolo para aprendizaje eficiente de Hamiltonianos de estados Gaussianos usando mediciones heterodinas e inversión local.
¿Pueden los modelos de lenguaje visual desarrollar intuiciones físicas mediante interacción? Un estudio revela que el aprendizaje por refuerzo no basta para generalizar reglas físicas.
Descubre cómo Avatar Forcing permite generar avatares interactivos en tiempo real que reaccionan a tu voz y gestos, con baja latencia y sin etiquetado. ¡Más del 80% de preferencia!
Nuevo método certifica la seguridad de robots autónomos con filtros de creencia menos conservadores, usando predicción conforme para una interacción humano-robot más eficiente y segura.
Descubre cómo un nuevo marco basado en la interacción humano-IA asigna responsabilidad cuando la IA autónoma causa daños. Tres tipos de interacción clave.
Descubre cómo la interacción se convierte en la unidad principal de análisis en la IA co-creativa, redefiniendo la inteligencia en sistemas humano-IA.
Entiende cómo la PID descompone la interacción entre modalidades en MLLMs, identificando sinergia y redundancia. Clave para mejorar razonamiento y grounding en IA.
Analítica del aprendizaje revela patrones distintos en interacción IA según nivel de alfabetización en GenAI. Estudio con 162 estudiantes.
Descubre cómo el uso guiado de LLMs en estadística mejora el aprendizaje autónomo y la calibración del conocimiento, superando el simple acceso a la IA.
Las señales del rostro superior mejoran el reconocimiento de frases bajo ruido. Un estudio revela su valor más allá de la boca en sistemas audiovisuales.
Conoce el innovador modelo SGAP-PPIS que predice sitios de interacción proteína-proteína usando propagación adaptativa.
Descubre cómo el empoderamiento aprende representaciones solo con lo relevante para el control, ignorando el ruido. Perspectiva causal desde la interacción.
Descubre GSAM, un marco robótico que mejora un 36% la tasa de éxito en manipulación de objetos articulados, reduciendo colisiones. ¡Lee más!
Los VLMs son buenos en razonamiento espacial pero fallan en interacciones multiturno. SpatialAct revela la brecha entre percepción y acción en 3D.