#rep · DeepCodeNews

PINNs de doble red para control óptimo: benchmark en sistema masa-resorte

Descubre cómo las PINNs de doble red resuelven el control óptimo de un sistema masa-resorte con alta precisión en un benchmark reproducible.

2026-06-16 · 2 min

Replay fuera de política: desaprendizaje eficiente en LLM

Aprende cómo ReRULE usa replay off-policy para desaprender LLMs, reutilizando casos difíciles y mejorando retención un 21% sin sacrificar rendimiento.

2026-06-16 · 2 min

Analizando representaciones visuales de aeronaves con autoencoders dispersos

Descubre cómo los autoencoders dispersos revelan patrones visuales en aeronaves, mejorando la interpretabilidad de modelos de IA.

2026-06-16 · 2 min

Simetría emergente de retokenización en modelos de lenguaje

La retokenización descubre una simetría oculta en modelos de lenguaje. Aprende cómo esta técnica mejora el muestreo y revela la comprensión composicional.

2026-06-16 · 2 min

EIBench: Un benchmark interactivo para la gestión emocional en IA

Descubre EIBench, un benchmark interactivo para gestión emocional. CTC-GRPO mejora la inteligencia emocional de los LLMs en múltiples turnos.

2026-06-16 · 2 min

Q-error y arrepentimiento del plan: tres regímenes

Descubre cuándo el q-error predice realmente la calidad de los planes de consulta y cómo tres regímenes de error revelan sus limitaciones. Un análisis basado

2026-06-16 · 2 min

Incentivos y evidencia en la orquestación de servicios aprendida

Analizamos por qué los sistemas de orquestación con RL no llegan a producción: sesgos, incentivos y necesidad de evidencia operativa.

2026-06-16 · 3 min

Descenso de Gradiente Funcional con Representaciones Adaptativas

Nuevo algoritmo de Descenso de Gradiente Funcional adapta representaciones, garantiza convergencia y supera a métodos tradicionales en eficiencia y precisión.

2026-06-16 · 2 min

Geometría de datos: revisión matemática de espacios de formas

Descubre cómo el análisis de espacios de formas revela patrones ocultos en datos geométricos. Revisión matemática para científicos de datos.

2026-06-16 · 2 min

Desenredo de Prompts con Guía de Lenguaje para Generalización de Dominio

Descubre cómo el desenredo de prompts con guía de lenguaje y alineación de representaciones mejora la generalización de dominio en modelos de visión con CLIP y

2026-06-16 · 1 min

Q-Learning con arrepentimiento fino basado en brechas

Nuevos algoritmos UCB y AMB mejoran el arrepentimiento fino dependiente de brecha en Q-Learning, superando limitaciones previas en MDP tabulares.

2026-06-16 · 2 min

Aprendizaje autosupervisado como comunicación discreta

Descubre cómo el aprendizaje autosupervisado se transforma en un proceso de comunicación discreta entre redes, mejorando la estructura de las representaciones

2026-06-16 · 2 min

Identificación del Mejor Brazo con Arrepentimiento Mínimo

Descubre cómo el algoritmo Double KL-UCB identifica el mejor brazo minimizando el arrepentimiento acumulado. Un avance clave en bandidos multimodales con

2026-06-16 · 2 min

RL eficiente guiando modelos del mundo con datos no curados

Descubre cómo guiar modelos del mundo con datos no curados acelera el aprendizaje por refuerzo, duplicando la puntuación en 72 tareas visuomotoras.

2026-06-16 · 2 min

Beneficios de la normalización de pesos en sensado matricial sobreparametrizado

Descubre cómo la normalización de pesos acelera exponencialmente la convergencia en detección de matrices sobreparametrizadas. Un avance teórico clave.

2026-06-16 · 2 min

Análisis espectral: características ricas no garantizan mejor generalización

Descubre cómo el análisis espectral de características moleculares revela que más datos no siempre mejoran la generalización en modelos de machine learning.

2026-06-16 · 3 min

Arrepentimiento Casi Óptimo en Bandidos Adversariales Distribuidos

Descubre cómo un nuevo algoritmo de caja negra logra arrepentimiento casi óptimo en bandidos adversariales distribuidos, superando records previos. ¡Lee más!

2026-06-16 · 2 min