#delos

APEX: Experto en Ingeniería Automática de Prompts con Selección Dinámica de Datos

Descubre APEX, un experto en ingeniería automática de prompts que usa selección dinámica de datos para optimizar LLMs, logrando mejoras de hasta 11% en Gemini.

2026-06-11 · 1 min

Evaluación automatizada de exámenes: justicia con modelos fundacionales

Descubre cómo los modelos fundacionales de IA logran un 98.4% de precisión en la corrección de exámenes manuscritos, reduciendo falsos negativos al 0.58% y garantizando equidad.

2026-06-11 · 3 min

Centros o periferias: selección de datos vía centralidad de grafo web

Descubre cómo WebGraphMix selecciona datos de preentrenamiento usando centralidad de grafo web, mejorando el rendimiento de modelos de lenguaje sin necesidad de etiquetado.

2026-06-11 · 2 min

Corrección justa y automatizada de exámenes con modelos fundacionales

Descubre cómo los modelos fundacionales de IA alcanzan un 98.4% de precisión en la corrección justa de exámenes manuscritos, reduciendo falsos negativos al 0.58%.

2026-06-11 · 2 min

¿Creen los modelos lo que dicen al rolear?

Un estudio revela que al rolear, los LLMs cambian lo que dicen pero no su representación interna. La desalineación emergente sí altera las creencias.

2026-06-11 · 2 min

Hubs o Fringes: Selección de datos de preentrenamiento con centralidad de grafos web

Descubre cómo WebGraphMix selecciona datos de preentrenamiento para IA usando la centralidad de la web, mejorando rendimiento sin etiquetas. 🔥

2026-06-11 · 2 min

Cuando los modelos de IA rolean, ¿creen lo que dicen?

¿Los LLM creen realmente sus afirmaciones al interpretar personajes? Un estudio revela diferencias entre roleplaying y desalineación emergente.

2026-06-11 · 2 min

ConsistencyPlanner: Planificación en tiempo real con modelos de consistencia

ConsistencyPlanner: planificación en tiempo real para autos autónomos con modelos de consistencia. Muestreo multimodal, fusión heterogénea y mejor seguridad.

2026-06-11 · 1 min

AVIS: Escalado Adaptativo en Tiempo de Prueba para Modelos de Visión-Lenguaje

Optimiza el equilibrio entre precisión y cómputo en VLMs con AVIS. Aprende cómo el escalado adaptativo mejora la eficiencia.

2026-06-11 · 2 min

ConsistencyPlanner: Planificación en tiempo real con modelos de consistencia

Descubre ConsistencyPlanner, un marco de planificación en tiempo real para conducción autónoma que usa modelos de consistencia para un muestreo multimodal eficiente y seguro.

2026-06-11 · 2 min

AVIS: Escalado Adaptativo en Tiempo de Prueba para Modelos de Visión-Lenguaje

Descubre cómo AVIS optimiza la inferencia en VLMs adaptando el escalado visual y de razonamiento, mejorando precisión y reduciendo costos.

2026-06-11 · 1 min

Redes neuronales destiladas con física y LLM para fabricación

Redes neuronales destiladas con física y LLM predicen propiedades en fabricación con alta precisión con datos escasos, para despliegue en tiempo real.

2026-06-11 · 2 min

Redes neuronales destiladas con física y LLMs para fabricación

Descubre cómo redes neuronales destiladas con física y LLMs predicen propiedades de fabricación incluso con datos escasos. Ideal para monitoreo en tiempo real.

2026-06-11 · 2 min

Cuando el contexto regresa: hacia una internalización robusta

Descubre cómo la reintroducción del contexto puede degradar el rendimiento de modelos destilados y cómo un nuevo regularizador de consistencia lo soluciona.

2026-06-11 · 3 min

Cuando el contexto regresa: internalización robusta en destilación on-policy

¿Sabías que reintroducir el contexto a un modelo destilado puede empeorar su rendimiento? Descubre cómo un ligero regularizador lo evita.

2026-06-11 · 2 min

¿Son los LLM malos en razonamiento moral?

¿Los LLM fallan en razonamiento moral? Un estudio revela que sus rúbricas morales superan expectativas. Descubre la competencia moral optimista de la IA.

2026-06-11 · 1 min

¿Son malos los LLMs en razonamiento moral?

¿Los LLMs son malos en razonamiento moral? Un nuevo análisis del dataset MoReBench sugiere que son más competentes de lo que se creía. Descubre los detalles.

2026-06-11 · 2 min

Evaluación de calidad y confiabilidad en datos generados por LLM

Descubre cómo evaluar la calidad y confiabilidad de datos generados por LLM con el marco LLM Data Auditor. Métricas intrínsecas para datos sintéticos.

2026-06-11 · 2 min