#agente

ChatSOP: Marco MCTS guiado por SOP para agentes de diálogo LLM controlables

ChatSOP mejora la controlabilidad de agentes de diálogo LLM: marco MCTS guiado por SOP logra un 27.95% más de precisión en acciones. Léelo.

2026-06-04 · 2 min

Embeddings Simpliciales mejoran eficiencia en agentes Actor-Critic

Descubre cómo los embeddings simpliciales mejoran la eficiencia muestral en Actor-Critic, acelerando el entrenamiento sin pérdida. Resultados: TD3, SAC, PPO.

2026-06-04 · 2 min

La topología importa: medición de fugas de memoria en LLMs multiagente

Descubre cómo la topología de red influye en las fugas de memoria en sistemas multiagente de LLM y obtén recomendaciones para un diseño seguro.

2026-06-04 · 3 min

Marco unificado para localidad en MARL escalable

Optimiza MARL escalable con un marco de localidad que descompone sensibilidad. Descubre cómo el control de temperatura softmax mejora la eficiencia.

2026-06-04 · 2 min

ShareVerse: Generación de Video Multi-Agente para Modelado de Mundo Compartido

Descubre ShareVerse, el framework que genera videos consistentes para múltiples agentes en entornos compartidos. Modelado de mundo real con IA.

2026-06-04 · 3 min

Seguridad bajo andamios: Condiciones de evaluación y su impacto en la seguridad

Los puntajes de seguridad en benchmarks no predicen el comportamiento real bajo andamios. Descubre cómo el formato y la arquitectura afectan la seguridad medida.

2026-06-04 · 2 min

Codificadores visuales con estado para modelos visión-lenguaje

Descubre cómo los codificadores visuales con estado mejoran los modelos visión-lenguaje en tareas multi-imagen y superan a modelos en radiología y teledetección

2026-06-04 · 3 min

Escalando datasets multi-sensor, multi-agente, multi-dominio sistemas autónomos

Escala datasets multi-sensor, multi-agente, multi-dominio para sistemas autónomos pipeline modular genera terabytes de datos etiquetados usando CARLA y AVstack.

2026-06-04 · 2 min

Escalando datasets para aprendizaje multisensor, multiagente y multidominio

Genera datasets etiquetados a escala para entrenar sistemas autónomos multisensor y multiagente con CARLA y AVstack.

2026-06-04 · 2 min

Replanteando la internalización de experiencia continua en agentes LLM

Descubre cómo evitar el colapso de capacidad en agentes LLM autoevolutivos mediante tres dimensiones clave: granularidad, inyección y régimen de internalización

2026-06-04 · 3 min

Consistencia Temporal de Memoria Episódica en MARL Cooperativo

EMTC mejora la consistencia temporal en memoria episódica para MARL cooperativo, superando cuellos de botella y logrando hasta un 28% de mejora en benchmarks.

2026-06-04 · 2 min

¿Pueden los agentes de ML garantizar la equidad?

¿Pueden los agentes de ML ser justos? Un estudio revela que generan pipelines con sesgos, incluso con indicaciones de equidad. ¡Entra y descúbrelo!

2026-06-04 · 1 min

Mejora de MADDPG con inferencia de acciones y muestreo por importancia

Mejora el algoritmo MADDPG con inferencia de acciones y muestreo por importancia para optimizar la cooperación y exploración en entornos multiagente.

2026-06-04 · 1 min

Inyección de prompt persistente entre sesiones en sistemas agénticos

Descubre cómo la inyección de prompt persistente entre sesiones transforma amenazas efímeras en vulnerabilidades sistémicas en sistemas agénticos de IA. Conoce los riesgos.

2026-06-04 · 2 min

CyberGym-E2E: Benchmark realista para IA en ciberseguridad extremo a extremo

CyberGym-E2E: el benchmark definitivo con 920 vulnerabilidades reales para evaluar la IA en ciberseguridad. ¡Descubrelo!

2026-06-04 · 1 min

SePO: Agente de Prompt Auto-Evolutivo para Optimización de Prompts de Sistema

SePO optimiza prompts de sistema sin modificar el modelo subyacente. Su enfoque auto-evolutivo mejora la precisión media un 4.49% en cinco benchmarks clave.

2026-06-04 · 2 min

Investigación profunda auto-evolutiva mediante generación y evaluación conjunta

Aprende cómo el marco SCORE mejora informes de investigación mediante la co-evolución de generación y evaluación, superando recompensas fijas.

2026-06-04 · 1 min

El orden temporal importa en la memoria de agentes: árboles de segmentos

Descubre cómo SegTreeMem mejora agentes conversacionales de largo plazo al preservar el orden temporal con árboles de segmentos.

2026-06-04 · 3 min

TIDE: Descubrimiento Proactivo de Problemas con Iteración Guiada

Descubre cómo TIDE, un framework iterativo con plantillas, detecta múltiples problemas ocultos en documentos, herramientas y código. Mejora la cobertura y resolución.

2026-06-04 · 1 min

Archi: Operaciones Agentivas en el Experimento CMS

Archi: marco de agentes de IA para el CMS del CERN. Integra documentación, datos históricos y monitoreo en vivo para apoyar a operadores técnicos.

2026-06-04 · 3 min