AlignAtt4LLM: Traducción simultánea con LLMs decoder-only
AlignAtt4LLM logra traducción simultánea inglés-alemán/italiano con baja latencia aplicando AlignAtt en LLMs solo decodificador. Resultados superiores.
AlignAtt4LLM logra traducción simultánea inglés-alemán/italiano con baja latencia aplicando AlignAtt en LLMs solo decodificador. Resultados superiores.
¿Los modelos de razonamiento grandes expresan su confianza de forma fiel? Cuantificamos la calibración entre incertidumbre interna y verbalizada, revelando desa
Descubre cómo los modelos de lenguaje pueden mejorar su memoria y aprender de forma continua imitando el sueño humano, con técnicas de destilación y ensueño.
Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.
MIND: nuevo marco de razonamiento activo para modelos multimodales. Emula el proceso humano entender-repensar-corregir. Logra SOTA.
Descubre EvoEnv, el nuevo benchmark que evalúa a los agentes IA en entornos laborales dinámicos: planificación, exploración y aprendizaje continuo.
Analizamos las perspectivas éticas sobre humanizar chatbots con IA: riesgos de dependencia, engaño y oportunidades para inclusión y bienestar.
PieArena mide la capacidad de negociación de los LLMs en escenarios reales. GPT-5 iguala o supera a humanos en este benchmark.
Descubre cómo X-RAY mapea la capacidad de razonamiento de los LLMs usando sondas formales y calibradas, revelando asimetrías y fallos interpretables.
Descubre cómo el benchmark REL evalúa el razonamiento relacional en LLMs, revelando sus limitaciones en tareas de alta aridad en ciencias.
Typhoon propone un enmascaramiento basado en gradientes para modelos de lenguaje. ¿Supera al enmascaramiento aleatorio? Los resultados no muestran mejoras significativas.
Descubre cómo PINNfluence interpreta las redes neuronales físicas informadas usando funciones de influencia para diagnosticar su comportamiento.
Descubre Align-KD, técnica que destila conocimiento de alineación multimodal de VLMs grandes a modelos móviles, mejorando precisión en 6 benchmarks.
Descubre cómo ReaLM usa cuantificación residual para alinear embeddings de grafos de conocimiento con LLMs, logrando rendimiento estado del arte.
Auditamos 1.5 millones de perfiles generados por IA: descubre los sesgos raciales y de género en 41 ocupaciones. Resultados reveladores.
NVIDIA Cosmos 3 unifica razonamiento físico, generación de mundos y acciones en un solo modelo abierto. Ideal para robótica y vehículos autónomos.
RTX Spark de Nvidia divide el mercado de PC con IA: laptops básicas vs estaciones premium. Descubre su impacto y precio.
Bancos británicos obtienen GPT-5.5 de OpenAI tras exclusión de Anthropic. ¿Cómo afecta la rivalidad entre IA a la ciberseguridad de infraestructuras críticas?
Descubre cómo la perspectiva codiciosa unifica dos técnicas de guía en generación. Ahorra cómputo sin perder precisión. Ideal para modelos de difusión.
Descubre Rex: solvers reversibles para ODE/SDE con precisión casi de máquina en generación y edición de imágenes.