De Hackeos de Recompensa a Estados de Riesgo: Monitoreo Contextual en Agentes
Aprende cómo la calibración por contexto y la entropía mejoran la detección de riesgos en agentes LLM frente a hackeos de recompensa.
Aprende cómo la calibración por contexto y la entropía mejoran la detección de riesgos en agentes LLM frente a hackeos de recompensa.
Descubre Benchmark Agent, un sistema autónomo que crea benchmarks de alta calidad para evaluar LLMs y MLLMs sin intervención humana. Ideal para investigación.
MLEvolve: marco auto-evolutivo para descubrimiento automático de algoritmos ML con agentes LLM. Logra récords en MLE-Bench y supera a AlphaEvolve.
Investigación muestra que las direcciones de seguridad pueden transferirse entre modelos generativos sin datos inseguros en el destino. Control portable y eficaz.
ReTreVal permite a LLMs aprender entre problemas durante la inferencia, mejorando el razonamiento sin ajuste fino. Logra 85.8% en MATH-500 y 54.4% en MMLU-Pro.
Descubre cómo NOVA protege a los agentes de uso de computadoras de inyecciones de prompts, combinando seguridad y rendimiento.
Descubre InfoDensity, un nuevo método de recompensa que optimiza el razonamiento de LLMs, reduciendo verbosidad y mejorando precisión y eficiencia.
PC-Talk: control preciso de animación facial en videos parlantes. Mejora sincronización labial y emociones con IA. Ideal para creadores.
FE-MAD: Aprende cómo un marco diferenciable con elementos finitos y redes neuronales identifica modelos constitutivos a partir de datos de deformación.
Descubre cómo reutilizar mecanismos de seguridad entre generadores visuales (texto a imagen y video) sin comprometer la calidad ni requerir datos sensibles en el modelo objetivo.
El gusano Miasma afectó 73 repositorios de Microsoft en GitHub, comprometiendo Azure y MicrosoftDocs. Conoce los detalles del ataque a la cadena de suministro.
Descubre cómo los desarrolladores supervisan agentes autónomos, los desafíos que enfrentan y las estrategias que utilizan para una colaboración efectiva.
Descubre cómo una guía instruccional de cinco pasos mejora el rendimiento en tareas de razonamiento con IA generativa. Estudio controlado en ingeniería.
Asegura tus datos con Data Flow Control: políticas de seguridad integradas en bases de datos para agentes IA, sin overhead y open source.
Nuevo marco de evaluación para detección acústica distribuida (DAS) con OTDR y asistencia Sagnac. Modelo de fusión dual alcanza 89.79% de precisión. Código abierto disponible.
TAM adapta torque para mover robots de forma robusta. Mejora ejecución real sin datos previos. Perfecto para manipulación dinámica.
MPCoT mejora las políticas VLA en control de largo plazo con razonamiento latente multi-ruta guiado por recompensa, sin generar tokens extra.
LatentWave: modelo base inalámbrico con preentrenamiento JEPA. Aprende representaciones latentes transferibles para clasificación, posicionamiento y predicción.
Descubre cómo las señales de denegación in-band hacen que agentes LLM autónomos se retiren voluntariamente. Resultados con GPT-4o y Claude Code.
TempoVLA controla la velocidad de robots manipuladores: acelera en zonas seguras y desacelera en contacto. Aumenta eficiencia y seguridad.