#aprendizaje

RLCSD: Aprendizaje por Refuerzo con Autodestilación Contrastiva

RLCSD mejora la autodestilación al contrastar señales con pistas correctas e incorrectas, superando la deriva de estilo y obteniendo mejores resultados que GRPO en razonamiento.

2026-06-11 · 3 min

DeMix: Depuración de datos de entrenamiento con errores mixtos

Aprende cómo DeMix diagnostica errores mixtos en datos de entrenamiento usando vectores de influencia. Logra un 22.61% más de precisión en limpieza de datos.

2026-06-11 · 1 min

Optimización convexa online con capacidad limitada y retroalimentación retrasada

Descubre cómo optimizar el aprendizaje online cuando la retroalimentación llega con retraso y los recursos de seguimiento son limitados. Nuevo algoritmo con garantías de rendimiento.

2026-06-11 · 3 min

Mecanismos de Olvido para Aprendizaje por Refuerzo No Estacionario

Descubre el novedoso mecanismo de olvido por decaimiento de valor espacial para RL no estacionario. ¡Mejora DQN y SAC!

2026-06-11 · 2 min

TaskFusion: Detección Continua de Anomalías en Datos Tabulares Heterogéneos

Descubre TaskFusion, un método de aprendizaje continuo que detecta anomalías en datos tabulares heterogéneos sin olvido catastrófico. Ideal para streaming de datos.

2026-06-11 · 3 min

RePAIR: aprendizaje auto-supervisado predictivo en ajedrez

Descubre RePAIR: nuevo método auto-supervisado que crea representaciones semánticas de ajedrez sin refuerzo. Ideal para análisis de partidas.

2026-06-11 · 2 min

HAMNO: Operador Neuronal Jerárquico Adaptativo Multiescala para Sistemas Dinámicos

Descubre HAMNO, un operador neuronal multiescala que combina convoluciones locales y operadores espectrales para predecir sistemas dinámicos complejos con precisión y estabilidad.

2026-06-11 · 2 min

Bandidos logísticos multinomiales eficientes con Frequent Directions

Descubre EOFD-MLogB: un algoritmo que reduce drásticamente el tiempo y espacio en bandidos logísticos multinomiales mediante sketching, manteniendo un alto rendimiento.

2026-06-11 · 2 min

PAWS: Aprendizaje de Preferencias con Segmentos Ponderados por Ventaja

PAWS alinea entrenamiento e inferencia en aprendizaje por preferencias usando segmentos ponderados por ventaja. Mejora políticas.

2026-06-11 · 1 min

La simplicidad basta para la inyección de ruido en parámetros SGD

La simplicidad basta: inyección de ruido en SGD mejora el entrenamiento de redes neuronales.

2026-06-11 · 2 min

Atención mediante sincronización en redes de osciladores acoplados

Sincronización de osciladores implementa atención sin exponenciación, superando a softmax en voz y gramática. Ideal para hardware eficiente.

2026-06-11 · 1 min

Clustering eficiente de series temporales multiescala con granular-ball

Aprende cómo MSRGC-Net logra clustering de series temporales eficiente y preciso usando reservorio multiescala y optimización granular-ball.

2026-06-11 · 3 min

Aprendizaje activo para descubrimiento de modelos en datos ultra-bajos

Descubre el método de aprendizaje activo con E-SINDy para descubrir modelos dispersos en sistemas dinámicos con datos ultra-bajos. Eficiente y preciso.

2026-06-11 · 2 min

Aprendizaje continuo con mezcla de experiencias en límites de soporte

Descubre cómo el método Experience Blending mejora el aprendizaje continuo hasta un 13% al regularizar límites de decisión con datos de soporte generados mediante ruido diferencial.

2026-06-11 · 2 min

Aprendizaje por refuerzo con observaciones activadas por acciones

Descubre cómo ATST-MDP optimiza el aprendizaje por refuerzo con observaciones activadas por acciones, mejorando la eficiencia en entornos parcialmente observables.

2026-06-11 · 2 min

Reutilización de capas por multiplexión temporal en redes neuronales físicas

Descubre cómo TIDAL-Net reutiliza capas por multiplexión temporal para aumentar profundidad en redes físicas sin costos extra. Mejora en clasificación y NLP.

2026-06-11 · 3 min

CaReTS: Marco unificado de clasificación y regresión para series temporales

CaReTS: marco multi-tarea que unifica clasificación y regresión para predicciones temporales más precisas e interpretables.

2026-06-11 · 2 min

Reverse Flow Matching: Marco Unificado para RL Online con Difusión y Flujo

Descubre cómo Reverse Flow Matching unifica métodos de difusión y flujo en RL online, mejorando la eficiencia y estabilidad del entrenamiento con Q-learning.

2026-06-11 · 2 min

Biyecciones analíticas para flujos normalizadores suaves e interpretables

Nuevas biyecciones analíticas para flujos normalizadores: suaves, interpretables e invertibles en forma cerrada. Flujos radiales con 1000x menos parámetros.

2026-06-11 · 1 min

Robustez de Mezclas de Expertos ante el Ruido de Características

Descubre cómo las Mezclas de Expertos (MoE) filtran el ruido en los datos, superando a redes densas en precisión y eficiencia. Resultados en tareas de lenguaje.

2026-06-11 · 3 min