Seguridad a nivel de sistema para agentes de uso de computadoras
Descubre cómo NOVA protege a los agentes de uso de computadoras de inyecciones de prompts, combinando seguridad y rendimiento.
Descubre cómo NOVA protege a los agentes de uso de computadoras de inyecciones de prompts, combinando seguridad y rendimiento.
Con Synapse, enruta herramientas federadas entre LLMs heterogéneos sin compartir datos, con privacidad diferencial y precisión casi sin pérdida.
Descubre cómo los LLM son aparentemente fieles a sus estructuras intermedias, pero fallan al ser intervenidos. Análisis causal revela fragilidad.
Descubre CLASH, el benchmark que evalúa cómo los modelos de lenguaje enfrentan dilemas de alto riesgo con múltiples perspectivas. Resultados sorprendentes sobre el razonamiento moral de la IA.
Descubre cómo SHAP y LLM explican las puntuaciones automáticas en evaluación docente. Análisis de fidelidad y transferibilidad en el marco CLASS.
Mejora la traducción de código con un pipeline que genera diálogos y traducciones verificadas usando dos LLM. Resultados sorprendentes en Fortran y CUDA.
Descubre cómo la diversidad geográfica en imágenes de IA revela sesgos: modelos antiguos más diversos y riesgo de estereotipos.
FE-MAD: Aprende cómo un marco diferenciable con elementos finitos y redes neuronales identifica modelos constitutivos a partir de datos de deformación.
Descubre cómo un consejo de LLMs locales evalúa hipótesis en neurociencia usando ontologías, revelando acuerdos y dispersión en la literatura.
Descubre cómo HypRAG usa geometría hiperbólica para mejorar la relevancia en RAG, reduciendo alucinaciones hasta un 29% con modelos más pequeños.
Descubre cómo Brain-CLIPLM decodifica lenguaje natural a partir de señales EEG mediante compresión semántica. Un enfoque innovador para recuperar frases desde anclas semánticas.
Descubre PERSUASIONTRACE, un marco para analizar cómo los LLM persuaden en diálogos multironda. Un modelo bayesiano de rastreo de creencias revela la dinámica de la persuasión.
Descubre cómo garantizar la seguridad en IA encarnada para tareas de largo plazo. Analizamos planificación, políticas y ejecución en manipulación robótica.
Un grupo de 49 matemáticos creó 100 preguntas de nivel investigador. Los LLMs más avanzados resolvieron 98 de ellas. Descubre los resultados del taller 'Benchmarks in Leipzig'.
Descubre cómo el método iCEM+TL mejora hasta un 23% el éxito en tareas de manipulación robótica mediante transferencia zero-shot, aplicable en robots reales.
LatentSkill convierte habilidades textuales en adaptadores LoRA modulares, reduciendo tokens de prefijo hasta un 72% y mejorando rendimiento en agentes LLM. Descubre cómo.
Descubre cómo ITP-STDP optimiza el entrenamiento de SNN con un diseño de hardware que reduce drásticamente el consumo energético y los recursos. ¡Innovación en IA!
TAM adapta torque para mover robots de forma robusta. Mejora ejecución real sin datos previos. Perfecto para manipulación dinámica.
Descubre el anclaje temporal uno a muchos: localiza múltiples segmentos con una consulta. Supera a Gemini con 43.65% EtF1.
Descubre EasyLens, un método plug-and-play que amplifica señales de lesiones sutiles en modelos médicos de IA, mejorando la detección sin necesidad de entrenamiento extra.