#trayecto

TempoVLA: Políticas de Visión-Lenguaje-Acción con Velocidad Controlable

TempoVLA controla la velocidad de robots manipuladores: acelera en zonas seguras y desacelera en contacto. Aumenta eficiencia y seguridad.

2026-06-06 · 1 min

DiffSlack: Aprendizaje con restricciones no lineales mediante variables slack

Aprende cómo DiffSlack impone restricciones no lineales en redes neuronales para planificación de trayectorias, mejorando tasa de éxito en vehículos autónomos.

2026-06-05 · 2 min

RL mejorado con Transformers: fundamentos y aplicaciones en redes

Descubre cómo los Transformers mejoran el RL en redes: fundamentos, recursos, enrutamiento y seguridad. ¡Optimiza tu red con IA!

2026-06-05 · 3 min

Alerta temprana de fallos con evidencia escasa en diálogos y agentes LLM

Descubre cómo identificar fallos en diálogos y agentes LLM con solo información parcial. Nuestro método de atención mejora la precisión temprana hasta un 42%.

2026-06-05 · 3 min

RHO: Optimización Autosupervisada del Arnés de Agentes LLM

RHO optimiza el arnés de agentes LLM usando solo trayectorias pasadas, sin etiquetas. Un solo ciclo mejora la tasa de acierto del 59% al 78% en SWE-Bench Pro.

2026-06-05 · 1 min

Aprendizaje de autocorrección en modelos visión-lenguaje mediante aumento de trayectorias

Descubre cómo Octopus-8B logra autocorrección eficiente en VLMs mediante aumento de trayectorias, superando a otros modelos con un 1.0 de puntuación y menor tiempo de entrenamiento.

2026-06-05 · 2 min

Dos canales F-Transform para caracterización temprana en correlación iterada

El descriptor F-Transform de dos canales caracteriza trayectorias tempranas en correlación iterada con alta precisión y baja dimensionalidad.

2026-06-05 · 3 min

Modelos Mundiales de Difusión Autoregresiva para Evaluar Agentes LLM

Descubre ADWM, un marco de evaluación offline que simula entornos interactivos para estimar el rendimiento de agentes LLM sin necesidad de ejecución en línea.

2026-06-05 · 2 min

AsyncWebRL: RL multi-paso eficiente para agentes web visuales

Descubre AsyncWebRL: un enfoque asíncrono que acelera el entrenamiento de agentes web visuales con RL multi-paso, logrando hasta 2.9x más rapidez y mejor rendimiento.

2026-06-05 · 1 min

Vulnerabilidad en inferencia: más allá de la seguridad superficial

Descubre cómo la seguridad superficial en LLMs es superada por inyecciones en medio de la generación. Nuevo método alinea modelos en trayectorias para mayor robustez.

2026-06-04 · 2 min

AgenticDiffusion: Navegación UAV con difusión y visión multiángulo

Descubre AgenticDiffusion: un marco que combina razonamiento lingüístico, visión multiángulo y difusión para lograr un 80% de éxito en navegación UAV en interiores.

2026-06-04 · 3 min

Síntesis de restricciones semánticas para optimización de trayectorias con LLMs

Descubre cómo los LLMs traducen requisitos de misión en código de optimización de trayectorias para misiones espaciales más seguras y eficientes.

2026-06-04 · 1 min

Predicción híbrida métrica-consciente para el desafío Lorenz CTF4Science

Descubre cómo un sistema híbrido métrica-consciente logró alta precisión en el desafío Lorenz al asignar diferentes predictores según la métrica: reconstrucción, pronóstico corto y largo plazo.

2026-06-04 · 2 min

Cómo el condicionamiento de éxito optimiza políticas de IA

El condicionamiento de éxito resuelve un problema de optimización con restricción de divergencia, mejorando políticas de IA sin degradar el rendimiento. ¡Descúbrelo!

2026-06-04 · 2 min

Flow Matching con Transporte Óptimo por Diseño

Aprende cómo reformular el problema de Flow Matching con transporte óptimo reduce curvatura y permite generación de imágenes de alta calidad en pocos pasos.

2026-06-04 · 2 min

Replanteando la internalización de experiencia continua en agentes LLM

Descubre cómo evitar el colapso de capacidad en agentes LLM autoevolutivos mediante tres dimensiones clave: granularidad, inyección y régimen de internalización

2026-06-04 · 3 min

Reutilizar trayectorias en gradientes de política permite convergencia rápida

El nuevo algoritmo RT-PG reutiliza trayectorias off-policy para acelerar la convergencia en métodos de gradientes de política, mejorando la eficiencia muestral.

2026-06-04 · 2 min

Reconciliando causalidad y termodinámica con modelos causales hamiltonianos

Nuevos modelos causales hamiltonianos reconcilian causalidad y termodinámica de no equilibrio. Aprende cómo miden la irreversibilidad en sistemas físicos.

2026-06-04 · 2 min

Traj-Evolve: Sistema multiagente autoevolutivo para detección de cáncer pulmonar

Traj-Evolve: un sistema autoevolutivo que mejora la detección temprana del cáncer de pulmón usando IA.

2026-06-03 · 2 min

Trayectorias de interacción efectivas para entrenar agentes terminales

Descubre por qué los agentes de IA más débiles pueden ser mejores maestros. Las trayectorias guiadas por el entorno logran eficiencia de datos excepcional.

2026-06-03 · 3 min