#general

FM-IRL: Flow-Matching para modelado de recompensas y regularización en RL

Descubre cómo FM-IRL combina Flow-Matching con RL para mejorar la exploración y generalización en políticas de aprendizaje por refuerzo.

2026-06-02 · 2 min

Simetrías en el aprendizaje PAC-Bayesiano

Descubre cómo las simetrías no compactas mejoran las cotas de generalización en PAC-Bayes. Experimentos validan la teoría.

2026-06-02 · 3 min

¿Pueden los modelos de lenguaje visual aprender física intuitiva?

¿Pueden los modelos de lenguaje visual desarrollar intuiciones físicas mediante interacción? Un estudio revela que el aprendizaje por refuerzo no basta para generalizar reglas físicas.

2026-06-02 · 2 min

Alineación controlable de valores en LLMs mediante edición a nivel neuronal

Descubre cómo NeVA alinea valores en LLMs con edición neuronal, evitando fugas indeseadas. Control fino sin reentrenamiento.

2026-06-02 · 2 min

Límites de generalización de longitud en transformers

Descubre por qué no existen límites computables de generalización de longitud para transformers y C-RASP, y cómo afecta al aprendizaje automático.

2026-06-02 · 2 min

Garantías de rendimiento probabilísticas para aprendizaje por refuerzo multitarea

Descubre cómo obtener garantías formales de rendimiento en aprendizaje por refuerzo multitarea para tareas no vistas, incluso con pocos datos.

2026-06-02 · 2 min

Garantías probabilísticas de rendimiento para refuerzo multitarea

Descubre garantías de rendimiento para políticas multitarea en tareas no vistas. Método que combina rollouts y generalización con alta confianza.

2026-06-02 · 3 min

Adaptación de Ruido Semi-Supervisada: Transferencia desde Dominio Ruidoso

Descubre cómo la adaptación de ruido semi-supervisada (SSNA) utiliza ruido sintético para mejorar la generalización de modelos de aprendizaje automático. ¡Optimiza tu rendimiento!

2026-06-02 · 2 min

Dialéctica del alineamiento: conocimiento inseguro para enrutamiento dinámico

SafeMoE aprovecha conocimiento inseguro para respuestas seguras e informativas, superando en un 20% la tasa de seguridad. Un nuevo paradigma en alineamiento.

2026-06-02 · 2 min

UME: Marco unificado de meta-generalización para ETA entre dominios

Descubre cómo UME revoluciona la predicción ETA multi-dominio con meta-aprendizaje, logrando zero-shot y superando cold-start y falta de datos.

2026-06-02 · 2 min

Funciones de Confianza: Generalización Débil a Fuerte sin Pérdidas

Aprende cómo las funciones de confianza filtran etiquetas débiles para lograr generalización casi sin pérdidas. Mejora tu IA.

2026-06-02 · 3 min

FSA: De características a dinámicas en predicción zero-shot de series temporales

Descubre FSA: método que transforma características en dinámicas para predecir series temporales nunca vistas, superando a Transformers con menos datos.

2026-06-02 · 2 min

Regresión cuantílica en extrapolación con colas pesadas: enfoque SVM

Aprende sobre un nuevo método SVM para regresión cuantílica con colas pesadas, ideal para extrapolar cuantiles extremos. Resultados en datos del río Danubio.

2026-06-02 · 2 min

Generalización rápida tras interpolación con momento críticamente amortiguado

Descubre cómo GROKtimizer logra una generalización rápida tras la interpolación, combinando convergencia veloz y minimización de normas con momento críticamente amortiguado.

2026-06-02 · 1 min

Aprendizaje en todas partes: IA con restricciones puntuales

Descubre el aprendizaje en todas partes: IA con restricciones puntuales mejora generalización mediante dualidad.

2026-06-02 · 3 min

Estabilidad en momento matricial ortogonalizado con muestreo de clientes

Estudio de estabilidad en generalización para optimización distribuida con momentos ortogonalizados y muestreo de clientes. Se derivan cotas finitas bajo heterogeneidad de datos.

2026-06-02 · 2 min

DenseMLLM: LLM multimodal estándar para predicción densa

Descubre cómo DenseMLLM permite a los LLM multimodales estándar realizar predicciones densas sin decodificadores adicionales. Resultados competitivos en segmentación y profundidad.

2026-06-02 · 2 min

Detector de anomalías discriminativo y generalizable para grafos dinámicos

Descubre un nuevo framework que aprende a detectar anomalías en grafos dinámicos con pocos datos etiquetados, logrando alta precisión y generalización.

2026-06-02 · 3 min

AffordGen: Demostraciones diversas para manipulación generalizable de objetos

AffordGen genera datos diversos para manipulación robótica con generalización zero-shot. Aumenta la eficiencia del aprendizaje por imitación.

2026-06-02 · 2 min

El análogo de Grokking en el preentrenamiento de modelos de lenguaje

Descubre cómo el fenómeno Grokking aparece en el preentrenamiento de LLMs, revelando una generalización gramatical retardada. Análisis de conceptos y atención en cabezas.

2026-06-02 · 3 min