#grandes

Método corrige localización de circuitos con retropropagación consciente

Aprende cómo GIM, un nuevo método de retropropagación, mejora la localización de circuitos en modelos de lenguaje al tener en cuenta interacciones.

2026-06-02 · 2 min

Aprendizaje off-policy: optimización > estimación en grandes acciones

Descubre por qué la optimización es clave en el aprendizaje off-policy con grandes espacios de acción, y cómo los pesos de verosimilitud simplifican el proceso.

2026-06-02 · 3 min

OncoReason: razonamiento clínico en LLMs para predicción de supervivencia

Nuevo marco OncoReason alinea LLMs con razonamiento clínico para predicción de supervivencia robusta e interpretable. Mejora F1 un 6% y reduce MAE un 12%.

2026-06-02 · 2 min

SmartThinker: Calibración Progresiva de Longitud CoT para Razonamiento Eficiente

SmartThinker calibra la longitud de cadena de pensamiento logrando hasta 52.5% de compresión y mejora de precisión en modelos de lenguaje grandes.

2026-06-02 · 2 min

CRAFT: Replicación eficiente de expertos en Mixture-of-Experts

Descubre CRAFT, un marco que replica expertos con granularidad fina para mejorar el rendimiento de modelos MoE hasta un 20% sin modificar el modelo.

2026-06-02 · 3 min

Límites de generalización no vacíos para redes profundas sin modificar

Por primera vez, se demuestran cotas de generalización no triviales para redes profundas sin modificaciones, incluso con 600M parámetros. Análisis basado en la geometría de los datos.

2026-06-02 · 2 min

RefLoRA: Adaptación de Bajo Rango Refactorizada para Modelos Grandes

Descubre RefLoRA, una nueva técnica de fine-tuning que acelera la convergencia y mejora el rendimiento de modelos grandes con mínimo costo computacional.

2026-06-02 · 2 min

Alineación controlable de valores en LLMs mediante edición a nivel neuronal

Descubre cómo NeVA alinea valores en LLMs con edición neuronal, evitando fugas indeseadas. Control fino sin reentrenamiento.

2026-06-02 · 2 min

Autoencoder Disperso a Nivel de Paso para Interpretar Razonamiento

Descubre cómo el autoencoder disperso a nivel de paso (SSAE) desentraña el razonamiento de los LLMs, revelando información sobre corrección y lógica. Ideal para interpretabilidad en IA.

2026-06-02 · 1 min

Descubriendo brechas de competencia en LLMs y sus benchmarks

Un método innovador con autoencoders revela brechas ocultas en LLMs y benchmarks. Mejora la evaluación de modelos de IA identificando conceptos débiles.

2026-06-02 · 2 min

ELF: Familia de modelos ECG-Lenguaje sin codificador

Descubre ELF, una familia de modelos ECG-Lenguaje sin codificador que supera a modelos complejos con arquitecturas más simples. ¡Resultados impresionantes!

2026-06-02 · 1 min

La forma más divertida de resistir: convierte tu bolso en un ciberdeck

Mujeres transforman sus bolsos en ciberdecks brillantes para protestar contra el poder de las grandes tecnológicas. Una forma divertida de resistencia digital.

2026-06-02 · 1 min

Descubrimiento científico evolucionable mediante minimización de incertidumbre

PiEvo revoluciona el descubrimiento científico al hacer evolucionar principios con IA. Logra un 31% más de calidad y un 83% de aceleración en la convergencia. Descúbrelo.

2026-06-02 · 2 min

TrOPD: Destilación On-Policy con Región de Confianza

TrOPD estabiliza la destilación on-policy de LLMs usando regiones de confianza, superando la divergencia profesor-alumno. Mejora razonamiento, código y benchmarks.

2026-06-02 · 2 min

Destilación On-Policy en Región de Confianza

TrOPD estabiliza la destilación on-policy en LLMs con regiones de confianza. Supera a OPD, EOPD y REOPOLD en razonamiento y código. ¡Descubre cómo!

2026-06-02 · 2 min

CRePE: Poda post-entrenamiento con importancia relativa convolucional

Descubre CRePE, método de poda post-entrenamiento para LLMs que reduce costos sin perder precisión, y PHO que acelera la búsqueda de hiperparámetros.

2026-06-02 · 2 min

Aprendizaje de redes con Gromov-Wasserstein semirrelajado

Descubre cómo el algoritmo semi-relajado de Gromov-Wasserstein permite estimar la estructura latente de redes masivas de forma eficiente, con garantías de consistencia y convergencia óptima.

2026-06-02 · 1 min

Picos masivos en LLMs: vectores de sesgo y cuantización sin picos

Descubre cómo los picos masivos en LLMs son vectores de sesgo y cómo la cuantización sin picos revoluciona la eficiencia de los modelos de IA. ¡Optimiza tu AI!

2026-06-02 · 2 min