ThoughtFold: Plegado de Cadenas de Razonamiento con Aprendizaje Introspectivo
Descubre ThoughtFold, un framework que elimina exploraciones redundantes en modelos de razonamiento, reduciendo tokens hasta un 56% sin perder precisión.
Descubre ThoughtFold, un framework que elimina exploraciones redundantes en modelos de razonamiento, reduciendo tokens hasta un 56% sin perder precisión.
Descubre cómo mejora la calificación automática de tareas C++ con BART y rúbricas: menor error y distribuciones de notas más realistas.
ReLoRA acelera la reutilización de adaptadores LoRA para servicios LLM en evolución, reduciendo tiempos de preparación hasta 8.9x y mejorando precisión un 4.6%.
Descubre cómo Margin Play usa MARL para analizar políticas públicas en el Margen Ecuatorial Brasileño y su impacto en el bienestar de Maranhão.
¿Demasiado sim2real? Aprende cómo el nuevo paradigma sim2sim2real evita el bloqueo del simulador y mejora la exploración de políticas.
Descubre cómo los modelos de machine learning causal superan a la regresión tradicional para medir el impacto de mejoras ambientales en el precio de viviendas, según simulación Monte Carlo.
Descubre TAO-RL, el nuevo marco que combina filtrado de trayectorias con exploración guiada por entropía para optimizar el razonamiento de LLMs con herramientas. Mejora la eficiencia y precisión.
Descubre EvoEnv, el nuevo benchmark que evalúa a los agentes IA en entornos laborales dinámicos: planificación, exploración y aprendizaje continuo.
Descubre Radio Garden: un globo 3D con estaciones de radio en vivo de todo el mundo. Escucha música, deportes y charlas locales. Viaja sin moverte.
Descubre cómo LoRA-MCL genera múltiples continuaciones de texto diversas y relevantes usando adaptadores de bajo rango. Ideal para subtitulado y traducción.
Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.
Descubre cómo el aprendizaje contrastivo permite a las GNN colorear grafos minimizando conflictos, superando métodos greedy. Resultados en grafos reales.
Aprende cómo la inferencia adaptativa con recursos limitados mejora la fijación de precios secuenciales. Identificación local y corrección de sesgo para decisiones precisas.
Aprende a combinar LoRAs sin entrenamiento con ponderación por prompt para lograr composiciones de múltiples conceptos con alta fidelidad.
Descubre DiffUNet², un modelo de difusión bidireccional que genera múltiples escenarios científicos y permite exploración visual interactiva de hipótesis.
Aprende a hacer fine-tuning del modelo LFM2 con QLoRA y DPO en Google Colab. Tutorial paso a paso con código abierto. ¡Mejora tu IA!
Descubre cómo el aprendizaje por refuerzo con asesoría experta y control de incertidumbre mejora la seguridad en la conducción autónoma. Resultados en CARLA.
Descubre MeSP: reduce un 49% la memoria al ajustar LLMs en dispositivos, con gradientes exactos. Ideal para entrenamiento privado.
Descubre por qué los kernels cuánticos escalares limitan el potencial de la IA cuántica y cómo los kernels operador-valorados pueden revolucionar el aprendizaje estructurado.
Descubre cómo la inferencia variacional con modelos de difusión permite reconstruir imágenes en ptychografía ciega a la posición, incluso con ruido. Resultados prometedores.