#algoritmo

Aprendizaje online en MDPs con transiciones y pérdidas adversariales parciales

Descubre nuevos algoritmos para MDPs con transiciones adversariales que logran regret sublineal. Basados en medidas de ocupación condicionadas.

2026-06-02 · 2 min

Cómo manejar bandidos contextuales con dinámica de estados latentes

Descubre un enfoque directo para manejar bandidos contextuales con estados latentes. Aprende cómo reducir el problema a bandidos lineales y mejorar las decisiones en entornos inciertos.

2026-06-02 · 2 min

Las 10 mejores series ahora según datos de streaming

Descubre las 10 series más populares según datos de streaming. Análisis basado en inteligencia artificial y big data para identificar las tendencias del momento.

2026-06-02 · 1 min

Propagación de Equilibrio para Sistemas No Conservativos

Descubre el nuevo algoritmo de propagación de equilibrio para sistemas no conservativos que calcula el gradiente exacto, con mejor rendimiento y aprendizaje más rápido.

2026-06-02 · 2 min

Identificación del mejor brazo: presupuesto fijo vs confianza fija

FC2FB transforma confianza fija en presupuesto fijo y demuestra igual complejidad hasta factores logarítmicos en identificación del mejor brazo.

2026-06-02 · 3 min

Transformers con normalización de capa aprenden el método de potencia

Transformers con normalización de capa aprenden el método de potencia por gradiente descendente, revelando un sesgo algorítmico que mejora la predicción de componentes principales.

2026-06-02 · 1 min

GNEP sin intercambio de multiplicadores: robótica y aprendizaje activo

Algoritmos GNEP sin compartir multiplicadores para robótica y aprendizaje activo con bandidos contextuales. Mejora eficiencia y privacidad.

2026-06-02 · 2 min

Programación de paquetes en línea con plazos y aprendizaje

Descubre cómo algoritmos de programación de paquetes en línea con plazos y aprendizaje bandido optimizan el QoS en redes, superando barreras de competitividad.

2026-06-02 · 2 min

Clasificación Estratégica Lineal con Mejoras Endógenas

Exploramos la clasificación estratégica lineal donde los agentes mejoran realmente tras el clasificador. Nuevo algoritmo con garantías PAC y validación en datos reales.

2026-06-02 · 2 min

DAGGER: Redes Amplificadoras Transitorias sin Gradiente

Descubre DAGGER, el nuevo algoritmo sin gradiente que construye redes amplificadoras transitorias con restricciones de conectividad. Hasta 100 veces más rápido.

2026-06-02 · 3 min

Clasificación Estratégica Lineal con Mejoras Endógenas

Descubre cómo los clasificadores lineales pueden manejar mejoras genuinas de los agentes, optimizando resultados reales. Análisis, algoritmos y garantías teóricas.

2026-06-02 · 2 min

DAGGER: construcción sin gradientes de redes amplificadoras transitorias

Descubre DAGGER, el nuevo algoritmo sin gradiente que construye redes amplificadoras transitorias preservando conectividad exacta. Hasta 100x más rápido.

2026-06-02 · 2 min

GPTQ-intrinsic LoRA: Cuantización de baja precisión con adaptación de bajo rango

GPTQ-intrinsic LoRA: mejora la cuantización de baja precisión con corrección de bajo rango. Algoritmo casi óptimo para modelos grandes.

2026-06-02 · 2 min

GPTQ-intrinsic LoRA: algoritmo cuasióptimo para cuantización y adaptación de bajo rango

GPTQ-intrinsic LoRA combina cuantización de baja precisión y adaptación de bajo rango para comprimir redes neuronales. Algoritmo sin entrenamiento mejora modelos como Qwen3 y DeiT.

2026-06-02 · 2 min

Abstracción de espacios combinatorios con GNN para optimización no lineal

Descubre cómo un nuevo método de abstracción basado en grafos dirigidos y GNN optimiza la búsqueda en problemas de optimización combinatoria no lineal, mejorando resultados y robustez.

2026-06-02 · 2 min

Aprendizaje en línea flexible de representaciones por similitud

Algoritmo en línea biológicamente plausible para representaciones dispersas e invariantes. Ideal para clustering, teselado y codificación en grandes datos.

2026-06-02 · 2 min

Identificar-Explotar Guiado por Árboles: Bandidos Duelistas

Descubre TG-ITE, el primer marco unificado para bandidos duelistas que logra O(N) en BAI y arrepentimiento. Optimiza identificación y explotación.

2026-06-02 · 1 min

Marco teórico para autoaprendizaje en demostración de teoremas

Descubre el marco teórico para algoritmos de auto-play que logran crecimiento exponencial de teoremas probados, con mejora de diversidad usando similitud de difusión.

2026-06-02 · 2 min

Aprendizaje de redes con Gromov-Wasserstein semirrelajado

Descubre cómo el algoritmo semi-relajado de Gromov-Wasserstein permite estimar la estructura latente de redes masivas de forma eficiente, con garantías de consistencia y convergencia óptima.

2026-06-02 · 1 min

Arrepentimiento minimax-óptimo en juegos de Markov parcialmente observables

Algoritmo optimista logra arrepentimiento minimax-óptimo en POMG. Complejidad O(√T) con dependencia de la dimensión de Eluder.

2026-06-02 · 3 min