#verificación

VulnAgent-R2: Auditoría multiagente calibrada para detección en repositorios

VulnAgent-R2 detecta vulnerabilidades en repositorios con auditoría multiagente calibrada, reduciendo costes y mejorando precisión. Descubre cómo.

2026-06-03 · 2 min

Repensando el ancho neuronal para proxies de flujo de potencia óptimo AC

Descubre cómo el algoritmo LG-ND optimiza el ancho neuronal para proxies ACOPF, reduciendo neuronas hasta 10 veces y garantizando verificación formal en sistemas críticos.

2026-06-03 · 1 min

Redefiniendo el ancho neuronal para proxies de ACOPF

Un algoritmo incremental (LG-ND) determina el ancho neuronal mínimo para proxies de ACOPF, logrando rendimiento equivalente con hasta 10x menos neuronas. Ideal para seguridad en redes eléctricas.

2026-06-03 · 1 min

Alinear estados ocultos verificados mejora razonamiento en RL

Hidden-Align alinea estados ocultos verificados para mejorar el razonamiento en RL, logrando hasta 6.2 puntos de mejora en benchmarks.

2026-06-03 · 2 min

El acierto hace la fuerza: alinear estados ocultos para RL

Hidden-Align alinea estados ocultos en modelos de lenguaje, mejorando el razonamiento matemático hasta un 6.2% en benchmarks. Técnica innovadora de RL.

2026-06-03 · 2 min

Visibilidad de falsos éxitos en manipulación robótica

¿Pueden los robots ocultar fallos? Un estudio revela que los falsos éxitos en manipulación son más detectables de lo que parece, pero el ruido los enmascara. Descubre cómo.

2026-06-03 · 3 min

MUSE: Un arnés agéntico unificado para MLLMs

Potencia MLLMs con MUSE, un arnés agéntico unificado que mejora tareas complejas sin reentrenar, usando verificación y reparación guiada.

2026-06-03 · 3 min

Arquitectura técnica de OpenAgenet/OAN para identidad y descubrimiento de agentes

Descubre la arquitectura técnica de OpenAgenet/OAN: capa de confianza neutra para identidad, registro y descubrimiento seguro de agentes.

2026-06-03 · 3 min

PhyDrawGen: Diagramas físicos desde texto natural

PhyDrawGen usa IA neuro-simbólica para crear diagramas de física exactos desde texto, eliminando alucinaciones y violaciones de leyes. Supera a GPT-5 y Gemini.

2026-06-03 · 3 min

MAVEN: Generalización mejorada en llamadas a herramientas de agentes

Descubre cómo MAVEN, un scaffold ligero de verificación, mejora la generalización en agentes de IA, logrando un 71% de precisión sin entrenamiento adicional y a 1/10 del coste.

2026-06-03 · 3 min

SERA: Agentes de Repositorio Eficientes con Verificación Suave

Descubre SERA, el método que entrena agentes de código abierto para repositorios privados con un costo 26x menor que RL. Acelera tu desarrollo con IA.

2026-06-03 · 5 min

MulFeRL: Retroalimentación verbal para aprendizaje por refuerzo en multiturno

MulFeRL mejora el aprendizaje por refuerzo usando retroalimentación verbal en múltiples turnos para superar recompensas escalares y potenciar el razonamiento.

2026-06-03 · 2 min

PolarMem: Memoria latente polarizada sin entrenamiento para VLMs verificables

PolarMem: sistema de memoria gráfica polarizada sin entrenamiento que verifica y reduce contradicciones en modelos de visión-lenguaje para un razonamiento multimodal confiable.

2026-06-03 · 2 min

LLM4Cov: Aprendizaje agéntico eficiente para testbench de alta cobertura

Descubre LLM4Cov, un marco de aprendizaje offline con agentes que logra un 90% de cobertura en verificación de hardware, superando modelos más grandes.

2026-06-03 · 1 min

AgentProcessBench: Evaluación de Calidad de Procesos en Agentes

AgentProcessBench: el primer benchmark para evaluar la calidad de cada paso en agentes. Mejora la supervisión de procesos en IA.

2026-06-03 · 3 min

FeynmanBench: El reto de los LLMs multimodales con diagramas de Feynman

FeynmanBench: 2000+ diagramas evalúan 19 LLMs. 70-95% en reconocimiento local, pero 13-17% en topología. Descubre las limitaciones.

2026-06-03 · 2 min

El Finish-Up-A-Thon de GitHub me empujó a finalizar EffortX

Descubre cómo EffortX, impulsado por IA y blockchain, mide la calidad de tus contribuciones en GitHub y genera pruebas verificables de tu impacto como desarrollador.

2026-06-03 · 1 min

¿Cómo determinar si una S Corp es una corporación?

Descubre cómo verificar si tu S Corp cumple como corporación según el IRS. Requisitos, documentación y pasos clave para evitar problemas fiscales.

2026-06-03 · 4 min

Android combate estafas telefónicas con nueva función de verificación

Nueva función en Android 12+ verifica llamadas con señal silenciosa, protegiéndote de estafas telefónicas.

2026-06-03 · 2 min

Verificación con herramientas para escalar cómputo en modelos pequeños de IA

Aprende cómo T1 permite a modelos pequeños de IA verificar respuestas con herramientas externas, logrando rendimiento superior a modelos 8 veces mayores.

2026-06-02 · 3 min