#tiempo de prueba

AdaMEM: Memoria Adaptativa en Tiempo de Prueba para Agentes de Lenguaje

AdaMEM: memoria adaptativa durante la inferencia para agentes de lenguaje. Mejora rendimiento hasta 13% en tareas complejas. ¡Descúbrelo!

2026-06-06 · 2 min

Cerrando el bucle del razonamiento latente con reconstrucción en tiempo de prueba

Descubre cómo ReLAT cierra el bucle del razonamiento latente usando reconstrucción en tiempo de prueba, mejorando precisión en matemáticas un 73.3% en AIME 2024

2026-06-06 · 2 min

Alpha-RTL: Entrenamiento en tiempo de prueba para optimización de hardware RTL

Descubre cómo Alpha-RTL reduce el producto PPA en un 65% mediante entrenamiento en tiempo de prueba con retroalimentación EDA, superando métodos tradicionales.

2026-06-05 · 3 min

BG-MCTS: Búsqueda en árbol con presupuesto fijo de tokens

Descubre cómo BG-MCTS optimiza búsqueda en árbol con presupuesto fijo de tokens para razonamiento superior.

2026-06-05 · 2 min

Agentic Monte Carlo: Aprendizaje por Refuerzo en Agentes Caja Negra

Optimiza agentes LLM de caja negra sin entrenarlos. Agentic Monte Carlo supera a GRPO. Aprende inferencia bayesiana.

2026-06-05 · 2 min

MesaNet: Entrenamiento Localmente Óptimo en Tiempo de Prueba

MesaNet optimiza el entrenamiento en tiempo de prueba para mejorar el rendimiento en secuencias largas. Menor perplejidad y mayor eficiencia.

2026-06-04 · 2 min

MesaNet: Modelado de secuencias con optimización en tiempo de prueba

Descubre MesaNet, un modelo recurrente que optimiza capa por capa en inferencia. Mejora rendimiento en contextos largos sin aumento lineal de memoria.

2026-06-04 · 2 min

Alineación de LLMs en test-time con muestreo de importancia en pre-logits

AISP alinea LLMs en tiempo de prueba usando muestreo de importancia en pre-logits. Logra mayores recompensas que best-of-n sin fine-tuning.

2026-06-04 · 2 min

Aprendiendo mientras actúan: co-evolución para agentes de aprendizaje continuo

Descubre LifeSkill, un marco de co-evolución que mejora habilidades en agentes de IA durante la inferencia. Aumenta un 7% el rendimiento en tareas largas.

2026-06-04 · 2 min

Verificación condicionada por confianza en RL en tiempo de prueba

Descubre cómo TTRL-CoCoV mejora Pass@k y Pass@1 en razonamiento complejo sin etiquetas, usando verificación condicionada por confianza.

2026-06-03 · 2 min

FutureWeaver: Optimización de Cómputo en Tiempo de Prueba Multi-Agente

Descubre FutureWeaver: optimiza cómputo en tiempo de prueba para sistemas multi-agente con planificación dual y colaboración modular. Con presupuesto limitado.

2026-06-03 · 1 min

Optimización en tiempo de prueba de planes de consulta física con LLMs

Descubre cómo los LLMs optimizan planes de consulta física en tiempo de prueba, logrando aceleraciones de hasta 4.78x en consultas OLAP. ¡Aumenta la eficiencia!

2026-06-03 · 3 min

UniScale: Optimización Unificada de Inferencia Adaptativa

UniScale unifica ruteo de modelos y escalado en prueba para optimizar calidad-coste en LLMs. Aprende cómo se adapta dinámicamente a cada solicitud.

2026-06-03 · 2 min

GradMem: Contexto en Memoria con Descenso de Gradiente en Tiempo de Prueba

Optimiza LLMs con GradMem: escribe contexto en memoria mediante descenso de gradiente en tiempo de prueba, reduciendo la necesidad de grandes cachés.

2026-06-03 · 2 min

Tempora: Evaluando la utilidad temporal de la adaptación en tiempo de prueba

Descubre cómo Tempora evalúa la adaptación en tiempo de prueba bajo presión temporal. Conoce métricas para elegir el mejor método según latencia y precisión.

2026-06-02 · 3 min

Guía de Recompensa con Muestras Anticipadas para Escalado de Modelos de Difusión

Aprende cómo LiDAR acelera 9.5x la guía de recompensa en modelos de difusión, mejorando la alineación con intenciones humanas.

2026-06-02 · 2 min

Cuándo y cuánto imaginar: Escalado adaptativo con modelos del mundo para razonamiento espacial

Descubre cuándo y cuánto imaginar en razonamiento espacial visual. AVIC optimiza el uso de modelos del mundo, superando a GPT-4o con menos recursos.

2026-06-02 · 1 min

Inferencia eficiente en tiempo de test para modelos de planificación generativa

Optimiza la inferencia en tiempo de prueba con el algoritmo OCL, mejorando eficiencia y calidad de soluciones en planificación generativa.

2026-06-02 · 2 min

DART: Entrenamiento en tiempo de prueba para reranking denso sin recursos

Descubre cómo DART adapta el modelo en tiempo de prueba para mejorar el reranking sin datos etiquetados, logrando +2.1% en NDCG@10 con mínima latencia.

2026-06-02 · 3 min

Adaptación secuencial con Fisher Prompting basado en martingalas

M-FISHER ofrece detección de cambios de distribución y adaptación en streaming con martingalas exponenciales y Fisher Prompting. Garantías estadísticas y estabilidad.

2026-06-01 · 1 min