#tro · DeepCodeNews

De Hackeos de Recompensa a Estados de Riesgo: Monitoreo Contextual en Agentes

Aprende cómo la calibración por contexto y la entropía mejoran la detección de riesgos en agentes LLM frente a hackeos de recompensa.

2026-06-06 · 2 min

Benchmark Agent: evalúa todo, en todas partes, a la vez

Descubre Benchmark Agent, un sistema autónomo que crea benchmarks de alta calidad para evaluar LLMs y MLLMs sin intervención humana. Ideal para investigación.

2026-06-06 · 2 min

MLEvolve: Framework autoevolutivo para descubrimiento de algoritmos ML

MLEvolve: marco auto-evolutivo para descubrimiento automático de algoritmos ML con agentes LLM. Logra récords en MLE-Bench y supera a AlphaEvolve.

2026-06-06 · 2 min

¿Comparten los modelos representaciones de seguridad? Control entre modelos

Investigación muestra que las direcciones de seguridad pueden transferirse entre modelos generativos sin datos inseguros en el destino. Control portable y eficaz.

2026-06-06 · 2 min

ReTreVal: Razonamiento en Árbol con Validación y Memoria entre Problemas

ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.

2026-06-06 · 2 min

Seguridad a nivel de sistema para agentes de uso de computadoras

Descubre cómo NOVA protege a los agentes de uso de computadoras de inyecciones de prompts, combinando seguridad y rendimiento.

2026-06-06 · 2 min

InfoDensity: Recompensando trazas densas en información

Descubre InfoDensity, un nuevo método de recompensa que optimiza el razonamiento de LLMs, reduciendo verbosidad y mejorando precisión y eficiencia.

2026-06-06 · 2 min

PC-Talk: Control Preciso de Animación Facial en Rostros Parlantes

PC-Talk: control preciso de animación facial en videos parlantes. Mejora sincronización labial y emociones con IA. Ideal para creadores.

2026-06-06 · 2 min

FE-MAD: aprendizaje de materiales basado en elementos finitos

FE-MAD: Aprende cómo un marco diferenciable con elementos finitos y redes neuronales identifica modelos constitutivos a partir de datos de deformación.

2026-06-06 · 2 min

Seguridad portable entre modelos de IA visual

Descubre cómo reutilizar mecanismos de seguridad entre generadores visuales (texto a imagen y video) sin comprometer la calidad ni requerir datos sensibles en el modelo objetivo.

2026-06-06 · 3 min

Gusano Miasma golpea 73 repositorios de Microsoft en GitHub

El gusano Miasma afectó 73 repositorios de Microsoft en GitHub, comprometiendo Azure y MicrosoftDocs. Conoce los detalles del ataque a la cadena de suministro.

2026-06-06 · 2 min

Supervisión humana de sistemas agentivos: desafíos y heurísticas

Descubre cómo los desarrolladores supervisan agentes autónomos, los desafíos que enfrentan y las estrategias que utilizan para una colaboración efectiva.

2026-06-06 · 3 min

El rol de la guía instruccional en el aprendizaje asistido por IA generativa

Descubre cómo una guía instruccional de cinco pasos mejora el rendimiento en tareas de razonamiento con IA generativa. Estudio controlado en ingeniería.

2026-06-06 · 3 min

Control de Flujo de Datos: Políticas de Seguridad para Agentes IA

Asegura tus datos con Data Flow Control: políticas de seguridad integradas en bases de datos para agentes IA, sin overhead y open source.

2026-06-06 · 3 min

Benchmark para detección acústica distribuida con OTDR y Sagnac

Nuevo marco de evaluación para detección acústica distribuida (DAS) con OTDR y asistencia Sagnac. Modelo de fusión dual alcanza 89.79% de precisión. Código abierto disponible.

2026-06-06 · 2 min

Módulo de Adaptación de Torque (TAM) para Transferencia Robusta de Movimiento

TAM adapta torque para mover robots de forma robusta. Mejora ejecución real sin datos previos. Perfecto para manipulación dinámica.

2026-06-06 · 3 min

MPCoT: Razonamiento latente multi-ruta guiado por recompensa para VLA

MPCoT mejora las políticas VLA en control de largo plazo con razonamiento latente multi-ruta guiado por recompensa, sin generar tokens extra.

2026-06-06 · 2 min

LatentWave: Preentrenamiento JEPA para modelos base inalámbricos

LatentWave: modelo base inalámbrico con preentrenamiento JEPA. Aprende representaciones latentes transferibles para clasificación, posicionamiento y predicción.

2026-06-06 · 1 min