#delos

Autointerpretación: adaptadores ligeros entrenados en pares vector-etiqueta

Cómo adaptadores ligeros entrenados en pares vector-etiqueta logran autointerpretación que supera etiquetas y revela razonamiento implícito.

2026-06-03 · 2 min

TimeOmni-VL: Modelos Unificados para Comprensión y Generación de Series Temporales

TimeOmni-VL unifica comprensión y generación de series temporales mediante visión, transformaciones bidireccionales sin pérdidas y generación guiada por entendimiento. ¡Lee más!

2026-06-03 · 1 min

CodeHacker: generación automatizada de pruebas para detectar vulnerabilidades

CodeHacker genera pruebas adversariales para detectar vulnerabilidades en soluciones de programación competitiva. Mejora benchmarks y entrena modelos de IA.

2026-06-03 · 2 min

Circuitos Probabilísticos Neuronales Causales

CNPC combina redes neuronales con circuitos causales para intervenciones precisas, mejorando la exactitud en modelos de caja de conceptos. ¡Resultados superiores!

2026-06-03 · 2 min

vLLM Semantic Router: Enrutamiento por señales para modelos multimodales

Descubre cómo vLLM Semantic Router optimiza el enrutamiento de modelos multimodales mediante señales composables, mejorando costos, privacidad y seguridad.

2026-06-03 · 2 min

Midiendo la legibilidad débil-a-fuerte en modelos de razonamiento

Evalúa la legibilidad débil-a-fuerte en modelos de razonamiento: cadenas de pensamiento claras para supervisión segura de IA.

2026-06-03 · 2 min

Evaluación Sistemática de Arquitecturas Actuales en Pronóstico de Energía Eólica

Descubre las arquitecturas híbridas con deep learning y descomposición modal mejoran la precisión del pronóstico eólico por intervalos, reduciendo incertidumbre.

2026-06-03 · 1 min

Predicción de Recurrencia de Cáncer de Mama con Machine Learning Multimodal

Descubre cómo integrar datos clínicos multimodales con ML mejora la predicción de recurrencia del cáncer de mama.

2026-06-03 · 1 min

Desaprendizaje rápido a gran escala vía autocorrección de margen

MASC ofrece desaprendizaje rápido a gran escala para modelos de lenguaje, sin reentrenamiento. Mejora la eficiencia y preserva la utilidad. ¡Conoce el método!

2026-06-03 · 3 min

BYORn: Genera tus propias respuestas para defender modelos de visión-lenguaje

Descubre BYORn, método que protege modelos visión-lenguaje durante fine-tuning contra ataques backdoor, mejorando robustez.

2026-06-03 · 2 min

Gate AI: Metodología y resultados de evaluación de seguridad en LLM

Descubre la metodología rigurosa de Gate AI para evaluar detectores de inyección y jailbreaks en LLM con umbral único y 16 benchmarks. Resultados sin sesgos.

2026-06-03 · 1 min

MOSAIC: Programación eficiente con agregación adaptativa y concurrencia

Descubre cómo MOSAIC acelera hasta 2.5x la etapa experta y 4.23x la agregación en sistemas MoA, con precisión similar. Optimiza tu inferencia en GPUs.

2026-06-03 · 1 min

¿Qué aprenden los estudiantes? Análisis del conocimiento oscuro

Descubre cómo la Destilación de Confusión (CD) mejora el aprendizaje de modelos sin profesor, superando a otros métodos en CIFAR-100.

2026-06-03 · 2 min

RMPrior: priors de propagación y difusión para mapas de radio eficientes

Descubre RMPrior: acelera 2x la construcción de mapas de radio combinando priors de propagación y difusión, mejorando precisión y eficiencia. ¡Lee más!

2026-06-03 · 2 min

RLVR: el costo oculto de olvidar problemas resueltos

Descubre el fenómeno de rotación del conjunto correcto en RLVR, donde modelos olvidan problemas resueltos. Conoce REMIND, una técnica que mejora la retención sin costo adicional.

2026-06-03 · 3 min

¿Qué aprenden los estudiantes? Análisis de características en KD

Analizamos el aprendizaje de características en destilación de conocimiento y presentamos Confusion Distillation, una auto-destilación eficiente que supera a otros métodos en 1.2%.

2026-06-03 · 2 min