#delos

Rastreo de circuitos en modelos de lenguaje de proteínas autoregresivos

Aprende cómo ProGenMech descubre circuitos neuronales en modelos de proteínas para mejorar la generación y predicción de fitness.

2026-06-16 · 3 min

Más allá del análisis de sangre: ML explicable para disglucemia

Aprende cómo el Machine Learning explicable detecta el riesgo de disglucemia sin análisis de sangre. Modelo LightGBM supera a pruebas clínicas tradicionales.

2026-06-16 · 2 min

Parada Adaptativa en Muestreo con Clasificadores

Descubre cómo detener el muestreador de forma inteligente usando clasificadores neuronales para acelerar MCMC sin perder precisión. ¡Entra!

2026-06-16 · 3 min

Auditoría de desaprendizaje automático: ¿realmente olvidan?

Descubre un marco de auditoría para comprobar si los modelos de IA realmente olvidan datos. Verifica el desaprendizaje sin reentrenar.

2026-06-16 · 3 min

Predicción de parámetros de ejecución con aprendizaje activo y generativo

Predice parámetros de ejecución en química computacional con aprendizaje activo y generativo. Modelos alcanzan 99.9% de precisión.

2026-06-16 · 2 min

QK-Normed MLA: normalización sin almacenar claves completas

Descubre cómo la normalización QK en MLA mejora estabilidad y eficiencia: menor pérdida, mayor precisión y menos de 2% de latencia extra en decodificación.

2026-06-16 · 2 min

RL offline con difusión para redes UAV eficientes y justas

Aprendizaje por refuerzo offline con difusión para redes UAV justas y eficientes. Reduce energía, mejora equidad y aumenta throughput un 35%.

2026-06-16 · 2 min

CacheMuon: Precondicionamiento Temporal para Aproximar el Factor Polar

CacheMuon acelera el entrenamiento al reutilizar información previa para aproximar el factor polar, reduciendo costos sin perder precisión. Descubre cómo.

2026-06-16 · 2 min

Entrenamiento Paralelo Eficiente en Ancho de Banda con Mezclas de Subespacios

Descubre cómo mezclas de subespacios comprimen la comunicación un 95% para entrenar modelos de lenguaje con contextos de 100K tokens, incluso en redes lentas.

2026-06-16 · 2 min

Taylor-Calibrate: Inicialización para destilación de atención lineal híbrida

Descubre cómo Taylor-Calibrate inicializa modelos de atención híbrida con 88x mejora y reduce tokens de entrenamiento 9.2x. Optimiza tus Transformers.

2026-06-16 · 2 min

Privacidad en inferencia de LLM mediante transformadores equivariantes ortogonales

Protege tu privacidad en inferencia de LLM con transformadores equivariantes ortogonales. Reduce recuperación de tokens del 35% al 1.3% sin aumentar

2026-06-16 · 2 min

BRICKS-WM: Modelos de Mundo Modulares para Reutilización en RL

Descubre BRICKS-WM: modelos modulares que permiten reutilizar dinámicas de fondo, reduciendo tiempos de reentrenamiento en RL.

2026-06-16 · 1 min

Estimación de cola en evaluación LLM: protocolo contra falsos positivos

Un estudio revela que estimar la cola en LLM es frágil y propone un protocolo para evitar falsos positivos. Descubre cómo.

2026-06-16 · 1 min

Cómo el post-entrenamiento da forma al razonamiento biológico

Nuevo estudio analiza más de 100 modelos: el post-entrenamiento no mejora uniformemente. Descubre la composición ideal para rendimiento dentro y fuera de

2026-06-16 · 3 min

Fiabilidad de la detección de símbolos en Modelos Cuello de Botella

Descubre cómo evaluar si los modelos de IA explicables detectan conceptos fiables o usan atajos. Un nuevo enfoque para mejorar la transparencia.

2026-06-16 · 2 min

MyPCBench: un benchmark para agentes inteligentes de uso personal de PC

MyPCBench evalúa agentes de IA como asistentes personales en escritorio Linux con 184 tareas reales. El mejor modelo (Claude Opus) solo resuelve 55.4%.

2026-06-16 · 2 min

Domando la Curvatura: Calentamiento de Arquitectura para Transformers Estables

Controla la curvatura del Hessiano con calentamiento de arquitectura para entrenar Transformers estables, reduciendo picos de pérdida.

2026-06-16 · 2 min

HawkesNest: Benchmark sintético multieje de complejidad espacio-temporal

Descubre HawkesNest, un benchmark sintético multieje para evaluar modelos de procesos puntuales espacio-temporales bajo condiciones de complejidad controlada.

2026-06-16 · 2 min

Hyperball: Optimizadores de Preentrenamiento Fantásticos

Descubre Hyperball, un wrapper que acelera el preentrenamiento de modelos de lenguaje hasta un 30% mejorando la convergencia. Optimizado para Muon y Adam.

2026-06-16 · 2 min

Estimación Exacta de Puntaje Posterior en Problemas Inversos Lineales

EPS: Método exacto de puntaje posterior para problemas inversos lineales con modelos de difusión. Supera a baselines en fidelidad y percepción.

2026-06-16 · 3 min