#muestra

Decisiones aversas al riesgo con garantía condicional a la acción

Descubre el nuevo método de predicción conforme que ofrece garantías condicionales a la acción para decisiones aversas al riesgo. Mejora la seguridad en IA.

2026-06-05 · 3 min

Convergencia Rápida y Robusta de TD(0) con Aproximación Lineal

Descubre cómo TD(0) con aproximación lineal logra una convergencia rápida y robusta, con tasa óptima de 1/k y sin depender del menor autovalor. Ideal para aprendizaje por refuerzo.

2026-06-05 · 2 min

Aprendizaje de operadores solución de EDP con aproximación dispersa

Descubre cómo los métodos de aproximación dispersa reducen muestras para operadores de EDP, mejorando eficiencia e interpretabilidad

2026-06-05 · 2 min

Aprendizaje resistente a ruido de etiquetas con OBD

Descubre cómo el enmascaramiento OBD intercepta gradientes ruidosos y mejora la robustez ante etiquetas erróneas. Resultados superiores en benchmarks.

2026-06-05 · 1 min

Leyes de escalamiento y espectros en redes neuronales superficiales

Descubre cómo las leyes de escalamiento en redes superficiales vinculan espectros de pesos y generalización, validando observaciones empíricas.

2026-06-05 · 2 min

Inferencia potenciada por datos sintéticos

Descubre cómo el framework GESPI combina datos sintéticos y reales para mejorar la inferencia estadística sin sacrificar precisión.

2026-06-05 · 2 min

Límites de precisión de árboles causales para efectos individualizados

Exploramos los límites de precisión de los árboles causales para efectos de tratamiento individualizados. ¿Por qué pueden converger lentamente y qué significa para la inferencia causal?

2026-06-05 · 3 min

CLaaS: Aprendizaje continuo como servicio para aprendizaje online eficiente

Descubre cómo CLaaS optimiza la adaptación de agentes de IA mediante aprendizaje continuo y replay de experiencia, mejorando la eficiencia de muestras en entornos dinámicos.

2026-06-05 · 1 min

Optimización Adaptativa de Rollouts para Post-Entrenamiento con RL

Descubre CERO, método adaptativo que optimiza rollouts en post-entrenamiento de LLMs. Supera a GRPO en razonamiento matemático. ¡Eficiencia mejorada!

2026-06-05 · 3 min

Pocos datos, grandes mapas: Entrenar modelos geoespaciales con muestras escasas

Descubre cómo entrenar modelos de machine learning geoespacial con pocas muestras etiquetadas. Técnicas prácticas para superar la escasez de datos.

2026-06-04 · 2 min

Tamaño del conjunto de calibración para LLM como juez: ¿50 o 200?

¿50 o 200 trazas? Aprende a determinar el tamaño de muestra para validar un LLM como juez según el balance de clases. La clave está en el kappa de Cohen.

2026-06-04 · 3 min

Explicaciones contrafactuales para pruebas de dos muestras profundas

Las explicaciones contrafactuales revelan qué características diferencian dos grupos en pruebas de hipótesis con deep learning. Un método basado en MMD y autoen

2026-06-04 · 3 min

Embeddings Simpliciales mejoran eficiencia en agentes Actor-Critic

Descubre cómo los embeddings simpliciales mejoran la eficiencia muestral en Actor-Critic, acelerando el entrenamiento sin pérdida. Resultados: TD3, SAC, PPO.

2026-06-04 · 2 min

Evolución Deliberada: Regresión Simbólica Eficiente con LLMs

Descubre cómo Deliberate Evolution usa razonamiento agentico y memoria reflexiva para regresión simbólica eficiente con solo 40% de muestras. ¡Más con menos!

2026-06-04 · 2 min

Reutilizar trayectorias en gradientes de política permite convergencia rápida

El nuevo algoritmo RT-PG reutiliza trayectorias off-policy para acelerar la convergencia en métodos de gradientes de política, mejorando la eficiencia muestral.

2026-06-04 · 2 min

Transporte Óptimo con Restricciones de Equidad de Grupo

Descubre cómo el transporte óptimo puede ser justo para grupos. Nuevo algoritmo Sinkhorn, relajaciones y equilibrio entre equidad y coste.

2026-06-04 · 2 min

Gradiente de Política para MDP Robustos en Tiempo Continuo

Descubre cómo los algoritmos de gradiente de política en tiempo continuo mejoran la robustez en MDPs, con convergencia lineal y menor complejidad muestral.

2026-06-04 · 2 min

El precio del aprendizaje transductivo multigrupo

El aprendizaje transductivo multigrupo incurre en una penalización lineal en la tasa de error que crece con el número de grupos. Conoce los detalles de este hallazgo.

2026-06-04 · 3 min