AdaptiveK: Autoencoders Dispersos por Complejidad
AdaptiveK ajusta dinámicamente la esparcidad según la complejidad semántica, mejorando interpretabilidad y reconstrucción de modelos de lenguaje.
AdaptiveK ajusta dinámicamente la esparcidad según la complejidad semántica, mejorando interpretabilidad y reconstrucción de modelos de lenguaje.
Alinea LLMs de caja negra en inferencia usando optimización restringida y teoría de juegos para balancear seguridad y utilidad.
FIRM alinea LLMs con múltiples objetivos eficientemente y en privado usando aprendizaje federado. Mejora equilibrio entre utilidad e inocuidad.
Descubre Quartet II, el método que optimiza el pre-entrenamiento de LLMs en formato NVFP4 en GPUs Blackwell. Mayor precisión y velocidad en tus modelos.
Descubre cómo DAPD mejora la precisión y velocidad en LLMs de difusión mediante decodificación paralela consciente de dependencias sin reentrenamiento.
Un método innovador con autoencoders revela brechas ocultas en LLMs y benchmarks. Mejora la evaluación de modelos de IA identificando conceptos débiles.
Descubre cómo datos sintéticos de calidad permiten las primeras leyes de escalado para LLMs en recomendación, superando datos reales.
Descubre cómo los LLMs reaccionan distinto ante contenido malicioso según si llega por usuario, metadatos o salidas de herramientas. Un estudio revela una asimetría de confianza.
Descubre cómo los LLMs como BERT, T5 y Llama se adaptan para detectar Alzheimer mediante fine-tuning y probing, logrando nuevos récords en datasets clínicos.
Descubre cómo la IA logra encontrar nuevos métodos de ataque adversarial contra LLMs, superando defensas avanzadas con tasas de éxito del 80% y 100%.
Descubre cómo SCOPE mejora el razonamiento de los LLMs con destilación adaptativa dual, logrando un 11.42% más de precisión.
Acelera la generación multimodal con DREAM-S, un novedoso método de decodificación especulativa que alcanza 3.85x de velocidad en VLMs.
Descubre cómo un archivo llms.txt evita que la IA genere Apex obsoleto en Salesforce. Pruebas con Opus, Sonnet y ChatGPT muestran la diferencia.
Descubre SimSD: un método de decodificación especulativa para modelos de difusión que acelera la inferencia hasta 7.46x sin sacrificar calidad.
Descubre cómo LEMAE usa LLMs para identificar estados clave y acelerar la exploración multiagente, con menos redundancia. Resultados superiores en SMAC y MPE.
Descubre cómo un nuevo benchmark evalúa el razonamiento interactivo de los LLMs mediante juegos ejecutables, midiendo éxito, eficiencia y adaptación metacognitiva.
Entiende cómo la PID descompone la interacción entre modalidades en MLLMs, identificando sinergia y redundancia. Clave para mejorar razonamiento y grounding en IA.
Descubre cómo los modelos de lenguaje deciden: la mayoría de respuestas correctas son inestables. Estudio en Qwen, Llama y Mistral.
Descubre cómo CardioLens revela la brecha entre el rendimiento en benchmarks y la realidad clínica de los MLLMs en resonancia cardíaca multi-secuencia
LLMs y EEG comparten un eje de valencia. La saturación limita la supervisión. Descubre cómo un ensamble mejoró un 10.5% la precisión en FACED.