#nsa

Tyler: Razonamiento Latente Tipado para LLMs

Tyler: Razonamiento Latente Tipado para LLMs

Descubre Tyler, un framework que optimiza el razonamiento latente en LLMs, mejorando precisión 14 puntos sobre CoT. Aprende cuándo y cómo asignar recursos.

2026-06-16 · 3 min

Uso de IA en ingeniería: equilibrio con propósito claro

Uso de IA en ingeniería: equilibrio con propósito claro

Los estudiantes de ingeniería valoran los LLMs para escritura y codificación, pero temen inexactitudes y dependencia. Conoce el equilibrio necesario para

2026-06-16 · 1 min

Gen-VCoT: Razonamiento visual con cadena de pensamiento generativa

Gen-VCoT: Razonamiento visual con cadena de pensamiento generativa

Descubre Gen-VCoT, un nuevo marco de razonamiento visual que usa imágenes RGB intermedias generadas por difusión para mejorar la interpretabilidad y precisión

2026-06-16 · 2 min

Más allá de pesos y gradientes: Taxonomía de mensajes en aprendizaje federado

Más allá de pesos y gradientes: Taxonomía de mensajes en aprendizaje federado

Descubre la nueva taxonomía de mensajes en aprendizaje federado más allá de pesos y gradientes. Analizamos costos, privacidad y tendencias en 202 publicaciones.

2026-06-16 · 2 min

TuneJury: Métrica abierta para alinear preferencias en música generada

TuneJury: Métrica abierta para alinear preferencias en música generada

Aprende cómo TuneJury mejora la generación musical con un modelo de recompensa par a par. Alinea preferencias humanas para mejores resultados.

2026-06-16 · 2 min

Sensado virtual para monitoreo en tiempo real de zonas inaccesibles

Sensado virtual para monitoreo en tiempo real de zonas inaccesibles

Descubre cómo MIMONet utiliza operadores neuronales para monitorizar en tiempo real zonas inaccesibles en sistemas energéticos, con errores menores al 5% y

2026-06-16 · 2 min

Seguridad Agéntica: Aplicaciones, Amenazas y Defensas

Seguridad Agéntica: Aplicaciones, Amenazas y Defensas

Descubre cómo los agentes basados en LLM transforman la ciberseguridad, sus amenazas y las defensas necesarias para protegerlos. Análisis completo.

2026-06-16 · 2 min

UniT: Escalado en tiempo de prueba con cadena de pensamiento multimodal

UniT: Escalado en tiempo de prueba con cadena de pensamiento multimodal

UniT permite a modelos unificados razonar, verificar y refinar en múltiples rondas, mejorando tareas complejas de composición visual y comprensión.

2026-06-16 · 2 min

¿La atención es solo acoplamiento? Una perspectiva ODE jerárquica

¿La atención es solo acoplamiento? Una perspectiva ODE jerárquica

Explora cómo el acoplamiento en transformers se modela con ecuaciones rápido-lento. Jerarquico sin ganancia de rendimiento pero con interpretacion teorica.

2026-06-16 · 2 min

RL eficiente para razonamiento visual-textual con difusión discreta

RL eficiente para razonamiento visual-textual con difusión discreta

Descubre cómo la difusión discreta reduce un 26.9% el cómputo en razonamiento visual-textual y la recompensa factorizada mejora un 11.2% el rendimiento.

2026-06-16 · 2 min

Dirección de políticas en tiempo de inferencia con visión y tacto

Dirección de políticas en tiempo de inferencia con visión y tacto

ViTaL: nuevo marco de guiado con visión y tacto mejora un 51% el éxito en manipulación robótica. Optimización bi-nivel para tareas de contacto.

2026-06-16 · 1 min

AutoDojo revela defensas superficiales en agentes LLM

AutoDojo revela defensas superficiales en agentes LLM

AutoDojo revela que las defensas contra inyección indirecta son superficiales: ataques adaptativos logran un 28% de éxito incluso con filtros perfectos.

2026-06-16 · 1 min

Reasoning Arena: Torneos de Trazas ante Recompensas Insuficientes

Reasoning Arena: Torneos de Trazas ante Recompensas Insuficientes

Reasoning Arena convierte recompensas planas en señales útiles con torneos de trazas, mejorando un 7.6% razonamiento y acelera entrenamiento un 41%.

2026-06-16 · 2 min

Aseguramiento de IA en Defensa UK: Desafíos operacionales JSP 936

Aseguramiento de IA en Defensa UK: Desafíos operacionales JSP 936

Conoce los desafíos técnicos y organizativos de implementar la directiva JSP 936 para aseguramiento de IA en defensa del Reino Unido.

2026-06-16 · 2 min

ReCoVLA: Compilación de Recompensas con VLM para Recuperación de Fallos

ReCoVLA: Compilación de Recompensas con VLM para Recuperación de Fallos

Descubre ReCoVLA, un método que usa modelos de lenguaje y visión para recuperar fallos en robots, mejorando el éxito en manipulación del 36.7% al 66.7% en

2026-06-16 · 2 min

Aprendiendo a Atacar y Defender: Red Teaming Adaptativo con GRPO

Aprendiendo a Atacar y Defender: Red Teaming Adaptativo con GRPO

Descubre cómo AdvGRPO entrena atacantes y defensores de modelos de lenguaje con GRPO, mejorando la seguridad frente a ataques. Resultados sorprendentes.

2026-06-16 · 3 min

CLPO: Aprendizaje Curricular para Razonamiento de LLMs

CLPO: Aprendizaje Curricular para Razonamiento de LLMs

CLPO combina aprendizaje curricular y optimización de políticas para mejorar el razonamiento de LLMs. Reestructura problemas y supera a GRPO y DAPO en 10

2026-06-16 · 2 min

MixReasoning: Cambio de Modos de Razonamiento

MixReasoning: Cambio de Modos de Razonamiento

Descubre MixReasoning, un innovador framework que adapta la profundidad del razonamiento en modelos de IA, reduciendo redundancia y mejorando la eficiencia sin

2026-06-16 · 2 min

MatSciBench: Evaluando la capacidad de razonamiento de los LLM en ciencia de materiales

MatSciBench: Evaluando la capacidad de razonamiento de los LLM en ciencia de materiales

MatSciBench evalúa LLM en ciencia de materiales: DeepSeek-R1 logra 75% en texto, GPT-5 53% en imágenes. Descubre sus limitaciones.

2026-06-16 · 2 min

MAR: Reflexión Multi-Agente para Mejorar Razonamiento en LLMs

MAR: Reflexión Multi-Agente para Mejorar Razonamiento en LLMs

Descubre cómo la reflexión multi-agente con múltiples personalidades supera la degeneración del pensamiento en LLMs, logrando un 47% en HotPot QA y 82.7% en

2026-06-16 · 2 min