#tm · DeepCodeNews

Escalado temporal universal de 1/3 en distribuciones puntiagudas

El entrenamiento de LLMs converge lentamente por una razón fundamental: softmax y entropía cruzada generan un escalado de pérdida universal 1/3. Descubre las implicaciones.

2026-06-02 · 2 min

Identificación del mejor brazo: presupuesto fijo vs confianza fija

FC2FB transforma confianza fija en presupuesto fijo y demuestra igual complejidad hasta factores logarítmicos en identificación del mejor brazo.

2026-06-02 · 3 min

Transformers con normalización de capa aprenden el método de potencia

Transformers con normalización de capa aprenden el método de potencia por gradiente descendente, revelando un sesgo algorítmico que mejora la predicción de componentes principales.

2026-06-02 · 1 min

DistMatch: Agrupación Adaptativa para Predicción Conformal Secuencial

Descubre DistMatch, nuevo método de agrupación adaptativa que mejora la robustez de la predicción conforme secuencial ante cambios de distribución.

2026-06-02 · 1 min

Dataset REST-ASMR: fotopletismografía y respuestas conductuales

Descubre REST-ASMR, un dataset multimodal que combina fotopletismografía y anotaciones subjetivas para predecir estados ASMR con alta precisión. Ideal para IA afectiva.

2026-06-02 · 2 min

GNEP sin intercambio de multiplicadores: robótica y aprendizaje activo

Algoritmos GNEP sin compartir multiplicadores para robótica y aprendizaje activo con bandidos contextuales. Mejora eficiencia y privacidad.

2026-06-02 · 2 min

Conciencia Parcial de Equidad en Aprendizaje Automático Estratégico

Descubre cómo la conciencia parcial de equidad resuelve el dilema entre transparencia y manipulación, mejorando la justicia en modelos de IA con un mecanismo guiado por creencias.

2026-06-02 · 2 min

Programación de paquetes en línea con plazos y aprendizaje

Descubre cómo algoritmos de programación de paquetes en línea con plazos y aprendizaje bandido optimizan el QoS en redes, superando barreras de competitividad.

2026-06-02 · 2 min

La estructura de la tarea invierte la codificación de estado por capas en modelos secuenciales

Descubre cómo la estructura de la tarea invierte la codificación de estado en modelos como Transformers y Mamba. Un estudio revela patrones opuestos en paridad y Dyck.

2026-06-02 · 3 min

Clasificación Estratégica Lineal con Mejoras Endógenas

Exploramos la clasificación estratégica lineal donde los agentes mejoran realmente tras el clasificador. Nuevo algoritmo con garantías PAC y validación en datos reales.

2026-06-02 · 2 min

DAGGER: Redes Amplificadoras Transitorias sin Gradiente

Descubre DAGGER, el nuevo algoritmo sin gradiente que construye redes amplificadoras transitorias con restricciones de conectividad. Hasta 100 veces más rápido.

2026-06-02 · 3 min

Clasificación Estratégica Lineal con Mejoras Endógenas

Descubre cómo los clasificadores lineales pueden manejar mejoras genuinas de los agentes, optimizando resultados reales. Análisis, algoritmos y garantías teóricas.

2026-06-02 · 2 min

DAGGER: construcción sin gradientes de redes amplificadoras transitorias

Descubre DAGGER, el nuevo algoritmo sin gradiente que construye redes amplificadoras transitorias preservando conectividad exacta. Hasta 100x más rápido.

2026-06-02 · 2 min

GPTQ-intrinsic LoRA: Cuantización de baja precisión con adaptación de bajo rango

GPTQ-intrinsic LoRA: mejora la cuantización de baja precisión con corrección de bajo rango. Algoritmo casi óptimo para modelos grandes.

2026-06-02 · 2 min

21cmEMUv3: emulador híbrido de observables del amanecer cósmico

Descubre 21cmEMUv3, emulador híbrido de difusión y LSTM que acelera la interpretación de observaciones del amanecer cósmico y reionización. Precisión subpercentual.

2026-06-02 · 2 min

GPTQ-intrinsic LoRA: algoritmo cuasióptimo para cuantización y adaptación de bajo rango

GPTQ-intrinsic LoRA combina cuantización de baja precisión y adaptación de bajo rango para comprimir redes neuronales. Algoritmo sin entrenamiento mejora modelos como Qwen3 y DeiT.

2026-06-02 · 2 min

Abstracción de espacios combinatorios con GNN para optimización no lineal

Descubre cómo un nuevo método de abstracción basado en grafos dirigidos y GNN optimiza la búsqueda en problemas de optimización combinatoria no lineal, mejorando resultados y robustez.

2026-06-02 · 2 min

Aprendizaje en línea flexible de representaciones por similitud

Algoritmo en línea biológicamente plausible para representaciones dispersas e invariantes. Ideal para clustering, teselado y codificación en grandes datos.

2026-06-02 · 2 min

Identificar-Explotar Guiado por Árboles: Bandidos Duelistas

Descubre TG-ITE, el primer marco unificado para bandidos duelistas que logra O(N) en BAI y arrepentimiento. Optimiza identificación y explotación.

2026-06-02 · 1 min

Marco teórico para autoaprendizaje en demostración de teoremas

Descubre el marco teórico para algoritmos de auto-play que logran crecimiento exponencial de teoremas probados, con mejora de diversidad usando similitud de difusión.

2026-06-02 · 2 min