#lora

ThoughtFold: Plegado de Cadenas de Razonamiento con Aprendizaje Introspectivo

Descubre ThoughtFold, un framework que elimina exploraciones redundantes en modelos de razonamiento, reduciendo tokens hasta un 56% sin perder precisión.

2026-06-03 · 2 min

Calificación automática de C++ con BART y rúbricas

Descubre cómo mejora la calificación automática de tareas C++ con BART y rúbricas: menor error y distribuciones de notas más realistas.

2026-06-03 · 2 min

ReLoRA: Adaptación rápida reutilizando conocimiento para servicios LLM

ReLoRA acelera la reutilización de adaptadores LoRA para servicios LLM en evolución, reduciendo tiempos de preparación hasta 8.9x y mejorando precisión un 4.6%.

2026-06-03 · 2 min

Margin Play: sistema multiagente para análisis de políticas en el Margen Ecuatorial Brasileño

Descubre cómo Margin Play usa MARL para analizar políticas públicas en el Margen Ecuatorial Brasileño y su impacto en el bienestar de Maranhão.

2026-06-03 · 2 min

El exceso de sim2real puede perjudicar el aprendizaje de políticas: cómo evitarlo

¿Demasiado sim2real? Aprende cómo el nuevo paradigma sim2sim2real evita el bloqueo del simulador y mejora la exploración de políticas.

2026-06-03 · 3 min

Machine learning causal para efectos ambientales en viviendas

Descubre cómo los modelos de machine learning causal superan a la regresión tradicional para medir el impacto de mejoras ambientales en el precio de viviendas, según simulación Monte Carlo.

2026-06-03 · 3 min

Optimización con herramientas y entropía para RL agente eficiente

Descubre TAO-RL, el nuevo marco que combina filtrado de trayectorias con exploración guiada por entropía para optimizar el razonamiento de LLMs con herramientas. Mejora la eficiencia y precisión.

2026-06-03 · 3 min

El primer día del agente: Evaluando aprendizaje, exploración y planificación

Descubre EvoEnv, el nuevo benchmark que evalúa a los agentes IA en entornos laborales dinámicos: planificación, exploración y aprendizaje continuo.

2026-06-03 · 2 min

Este sitio me hizo redescubrir la radio por internet

Descubre Radio Garden: un globo 3D con estaciones de radio en vivo de todo el mundo. Escucha música, deportes y charlas locales. Viaja sin moverte.

2026-06-03 · 3 min

Múltiples opciones en modelos de lenguaje con adaptadores de bajo rango

Descubre cómo LoRA-MCL genera múltiples continuaciones de texto diversas y relevantes usando adaptadores de bajo rango. Ideal para subtitulado y traducción.

2026-06-03 · 2 min

Compress then Merge: cómo fusionar LoRAs en un único adaptador

Descubre cómo fusionar múltiples LoRAs en un solo adaptador de bajo rango con Compress-then-Merge, mejorando eficiencia y rendimiento sin perder estructura.

2026-06-03 · 3 min

Razonamiento Algorítmico Neuronal Contrastivo para Coloreado de Grafos

Descubre cómo el aprendizaje contrastivo permite a las GNN colorear grafos minimizando conflictos, superando métodos greedy. Resultados en grafos reales.

2026-06-03 · 2 min

Inferencia adaptativa en precios secuenciales con recursos limitados

Aprende cómo la inferencia adaptativa con recursos limitados mejora la fijación de precios secuenciales. Identificación local y corrección de sesgo para decisiones precisas.

2026-06-03 · 2 min

Composición LoRA multiconcepto sin entrenamiento con ponderación por prompt

Aprende a combinar LoRAs sin entrenamiento con ponderación por prompt para lograr composiciones de múltiples conceptos con alta fidelidad.

2026-06-03 · 3 min

DiffUNet²: predicción bidireccional y generación probabilística para datos científicos

Descubre DiffUNet², un modelo de difusión bidireccional que genera múltiples escenarios científicos y permite exploración visual interactiva de hipótesis.

2026-06-03 · 3 min

Ajuste fino de LFM2 con QLoRA y DPO: Tutorial en Google Colab

Aprende a hacer fine-tuning del modelo LFM2 con QLoRA y DPO en Google Colab. Tutorial paso a paso con código abierto. ¡Mejora tu IA!

2026-06-03 · 3 min

Aprendizaje de refuerzo con incertidumbre y asesoría temporal para autónomos

Descubre cómo el aprendizaje por refuerzo con asesoría experta y control de incertidumbre mejora la seguridad en la conducción autónoma. Resultados en CARLA.

2026-06-03 · 2 min

Backpropagación Estructurada Eficiente en Memoria para Ajuste Fino de LLM

Descubre MeSP: reduce un 49% la memoria al ajustar LLMs en dispositivos, con gradientes exactos. Ideal para entrenamiento privado.

2026-06-03 · 2 min

Kernels cuánticos: más allá de los valores escalares para aprovechar su potencial

Descubre por qué los kernels cuánticos escalares limitan el potencial de la IA cuántica y cómo los kernels operador-valorados pueden revolucionar el aprendizaje estructurado.

2026-06-03 · 2 min

Ptychografía ciega a la posición: viabilidad con inferencia variacional

Descubre cómo la inferencia variacional con modelos de difusión permite reconstruir imágenes en ptychografía ciega a la posición, incluso con ruido. Resultados prometedores.

2026-06-03 · 3 min