#agente

La Mesa Redonda Virtual: Personas Multi-Agente Simulan el Brainstorming Humano

Descubre cómo un sistema multi-agente simula el brainstorming humano con personas virtuales. Genera ideas diversas y las evalúa. Caso: gafas inteligentes.

2026-06-06 · 1 min

Percepción Activa de Video: Búsqueda Iterativa de Evidencia para Video Largo

Descubre cómo AVP reduce un 81% el tiempo de inferencia y mejora la precisión al entender videos largos buscando evidencia clave.

2026-06-06 · 3 min

A2RAG: Recuperación Adaptativa con Grafos para Razonamiento Confiable

A2RAG: marco adaptativo para recuperación con grafos que reduce costos y mejora precisión en preguntas complejas. +11% recall, 50% menos tokens.

2026-06-06 · 1 min

OG-MAR: Alineamiento cultural de LLMs mediante ontología y multiagentes

OG-MAR alinea LLMs con valores culturales usando ontología y multiagentes. Mejora transparencia y precisión.

2026-06-06 · 2 min

Seguridad condicionada al dominio en agentes informáticos de frontera

Nuevo benchmark de 793 episodios revela que los agentes informáticos resisten ataques en navegador pero son vulnerables en codificación. Implicaciones para la seguridad de IA.

2026-06-06 · 3 min

Contaminación en tiempo de búsqueda en agentes de investigación profunda

Descubre cómo la contaminación en búsqueda infla el rendimiento de agentes de IA en benchmarks. Aprende a detectarla y mitigarla.

2026-06-06 · 1 min

Agente de IA personal para VQA en galería de fotos

Un agente de IA personal responde preguntas visuales sobre tu galería. El dataset Camroll y agente Camroll-Agent con memoria jerárquica.

2026-06-06 · 2 min

Agente de IA descubre 21 vulnerabilidades en FFmpeg; Chrome corrige récord de 429 fallos

Un agente de IA descubre 21 zero-days en FFmpeg mientras Chrome lanza parche récord con 429 correcciones. Más detalles.

2026-06-06 · 1 min

Supervisión humana de sistemas agentivos: desafíos y heurísticas

Descubre cómo los desarrolladores supervisan agentes autónomos, los desafíos que enfrentan y las estrategias que utilizan para una colaboración efectiva.

2026-06-06 · 3 min

VASO: Habilidades Autoevolutivas Verificables para Agentes de IA Física

Descubre cómo VASO revoluciona las habilidades robóticas: verificación formal guía su evolución, logrando un 97.2% de cumplimiento con menos de 100 muestras.

2026-06-06 · 3 min

ADK Arena: Evaluando Kits de Agentes con LLM como Desarrollador

Descubre cómo el LLM como desarrollador evalúa 51 frameworks de agentes. Costos variables y ningún dominante: hasta el 80% de tareas resueltas.

2026-06-06 · 2 min

ArcANE: ¿Los agentes de rol actúan según su arco narrativo?

ArcANE evalúa si los agentes de rol mantienen la coherencia psicológica según el arco narrativo, en situaciones nuevas. Mejora tus modelos con este benchmark.

2026-06-06 · 3 min

TensorBench: Evaluando agentes de código en framework tensorial con compilador

Descubre TensorBench, un nuevo benchmark que evalúa agentes de código en un framework de tensores basado en compilador. Resultados clave y tasas de éxito.

2026-06-06 · 3 min

El fin de la ingeniería de software: agentes de IA reestructuran el paradigma

Los agentes de IA reestructuran el paradigma del software. Descubre el fin de la ingeniería tradicional y el auge de los sistemas agentivos. Basado en el estudio arXiv:2606.05608.

2026-06-06 · 3 min

Optimización de Memoria en Bucle Cerrado para Ingeniería de Software

Aumenta la tasa de éxito de agentes de software en un 5.25% con optimización de memoria en bucle cerrado.

2026-06-06 · 2 min

Estudio comparativo de RAG adaptativo orquestado por agentes

Estudio comparativo de RAG adaptativo orquestado por agentes: mejoras en precisión en dominios estructurados pero costos de latencia en multi-salto.

2026-06-06 · 3 min

Control de Flujo de Datos: Políticas de Seguridad para Agentes IA

Asegura tus datos con Data Flow Control: políticas de seguridad integradas en bases de datos para agentes IA, sin overhead y open source.

2026-06-06 · 3 min

Arquitectura Microskill: marco modular para código nativo en IA

Descubre cómo Microskill reduce tokens un 90%, duplica compilaciones y elimina violaciones arquitectónicas, con evolución autónoma.

2026-06-06 · 2 min

MARDoc: Agente de Refinamiento con Memoria para QA Multimodal

Descubre MARDoc, un innovador marco de agente con memoria estructurada que mejora la precisión en QA de documentos largos multimodales. Reduce ruido y optimiza razonamiento.

2026-06-06 · 1 min

EGTR-Review: Revisión científica con evidencia y destilación multiagente

Descubre cómo EGTR-Review revoluciona la revisión por pares: reduce costes y mejora la trazabilidad con destilación multiagente basada en evidencia.

2026-06-06 · 2 min