#ip · DeepCodeNews

Seguridad a nivel de sistema para agentes de uso de computadoras

Descubre cómo NOVA protege a los agentes de uso de computadoras de inyecciones de prompts, combinando seguridad y rendimiento.

2026-06-06 · 2 min

Synapse: Enrutamiento Federado de Herramientas con Compendios Tipados

Con Synapse, enruta herramientas federadas entre LLMs heterogéneos sin compartir datos, con privacidad diferencial y precisión casi sin pérdida.

2026-06-06 · 2 min

Rompiendo la cadena: fidelidad causal de LLM a estructuras intermedias

Descubre cómo los LLM son aparentemente fieles a sus estructuras intermedias, pero fallan al ser intervenidos. Análisis causal revela fragilidad.

2026-06-06 · 2 min

CLASH: Evaluación de modelos de lenguaje en dilemas de alto riesgo

Descubre CLASH, el benchmark que evalúa cómo los modelos de lenguaje enfrentan dilemas de alto riesgo con múltiples perspectivas. Resultados sorprendentes sobre el razonamiento moral de la IA.

2026-06-06 · 2 min

De la puntuación a las explicaciones: Evaluando SHAP y LLM en evaluación docente

Descubre cómo SHAP y LLM explican las puntuaciones automáticas en evaluación docente. Análisis de fidelidad y transferibilidad en el marco CLASS.

2026-06-06 · 3 min

Más allá de pares de código: diálogos para traducción de LLM

Mejora la traducción de código con un pipeline que genera diálogos y traducciones verificadas usando dos LLM. Resultados sorprendentes en Fortran y CUDA.

2026-06-06 · 1 min

Diversidad geográfica en representaciones de IA en imágenes

Descubre cómo la diversidad geográfica en imágenes de IA revela sesgos: modelos antiguos más diversos y riesgo de estereotipos.

2026-06-06 · 1 min

FE-MAD: aprendizaje de materiales basado en elementos finitos

FE-MAD: Aprende cómo un marco diferenciable con elementos finitos y redes neuronales identifica modelos constitutivos a partir de datos de deformación.

2026-06-06 · 2 min

Evaluación multi-LLM con ontología de hipótesis en procesamiento predictivo

Descubre cómo un consejo de LLMs locales evalúa hipótesis en neurociencia usando ontologías, revelando acuerdos y dispersión en la literatura.

2026-06-06 · 3 min

HypRAG: Recuperación densa hiperbólica para RAG

Descubre cómo HypRAG usa geometría hiperbólica para mejorar la relevancia en RAG, reduciendo alucinaciones hasta un 29% con modelos más pequeños.

2026-06-06 · 2 min

Brain-CLIPLM: Compresión Semántica para Decodificación de EEG a Texto

Descubre cómo Brain-CLIPLM decodifica lenguaje natural a partir de señales EEG mediante compresión semántica. Un enfoque innovador para recuperar frases desde anclas semánticas.

2026-06-06 · 2 min

Modelo de persuasión multironda con rastreo probabilístico de creencias

Descubre PERSUASIONTRACE, un marco para analizar cómo los LLM persuaden en diálogos multironda. Un modelo bayesiano de rastreo de creencias revela la dinámica de la persuasión.

2026-06-06 · 2 min

Análisis transversal de seguridad en IA encarnada para tareas de largo plazo

Descubre cómo garantizar la seguridad en IA encarnada para tareas de largo plazo. Analizamos planificación, políticas y ejecución en manipulación robótica.

2026-06-06 · 3 min

Benchmarks en Leipzig: 100 preguntas matemáticas para IA

Un grupo de 49 matemáticos creó 100 preguntas de nivel investigador. Los LLMs más avanzados resolvieron 98 de ellas. Descubre los resultados del taller 'Benchmarks in Leipzig'.

2026-06-06 · 2 min

Planificación de movimiento robótico de bajo nivel con transferencia zero-shot

Descubre cómo el método iCEM+TL mejora hasta un 23% el éxito en tareas de manipulación robótica mediante transferencia zero-shot, aplicable en robots reales.

2026-06-06 · 2 min

LatentSkill: Habilidades latentes en pesos para agentes LLM

LatentSkill convierte habilidades textuales en adaptadores LoRA modulares, reduciendo tokens de prefijo hasta un 72% y mejorando rendimiento en agentes LLM. Descubre cómo.

2026-06-06 · 1 min

ITP-STDP: Motor de aprendizaje eficiente para SNN en chip

Descubre cómo ITP-STDP optimiza el entrenamiento de SNN con un diseño de hardware que reduce drásticamente el consumo energético y los recursos. ¡Innovación en IA!

2026-06-06 · 2 min

Módulo de Adaptación de Torque (TAM) para Transferencia Robusta de Movimiento

TAM adapta torque para mover robots de forma robusta. Mejora ejecución real sin datos previos. Perfecto para manipulación dinámica.

2026-06-06 · 3 min

Anclaje temporal uno a muchos en video

Descubre el anclaje temporal uno a muchos: localiza múltiples segmentos con una consulta. Supera a Gemini con 43.65% EtF1.

2026-06-06 · 2 min

EasyLens: Amplificador sin Entrenamiento de Lesiones Sutiles para Modelos Médicos

Descubre EasyLens, un método plug-and-play que amplifica señales de lesiones sutiles en modelos médicos de IA, mejorando la detección sin necesidad de entrenamiento extra.

2026-06-06 · 2 min