#delos

VESTA: Generación automatizada y evaluación de seguridad para agentes LLM

Descubre VESTA, el nuevo marco automatizado que genera escenarios y evalúa la seguridad de agentes LLM, revelando altos riesgos en su ejecución.

2026-06-17 · 2 min

DN-Hypo-Pipeline: Generación de hipótesis con IA y LLMs

El pipeline DN-Hypo-Pipeline usa IA y LLMs para generar hipótesis desde explicaciones científicas, superando métodos directos. Validado con algoritmos.

2026-06-17 · 2 min

Predicción de trayectorias y destino de buques con LLMs de razonamiento

Descubre cómo los LLMs con razonamiento y verificación mejoran la predicción de trayectorias y destino de buques a 30 días, superando a métodos tradicionales.

2026-06-17 · 2 min

Razonamiento Matemático con IA: Modelos, Neuro-simbólicos y Descubrimiento

Descubre la evolución de la IA en matemáticas: desde problemas con lenguaje natural hasta sistemas neuro-simbólicos y descubrimientos verificados.

2026-06-17 · 1 min

Q-Delta: Más allá de la evolución asociativa clave-valor

Descubre Q-Delta, regla delta que integra errores de predicción clave-consulta en evolución de estado, mejorando eficiencia y precisión en atención lineal.

2026-06-17 · 2 min

Optimización de políticas con señales intrínsecas densas

Descubre cómo ISPO usa señales intrínsecas densas para superar fallos en el razonamiento de modelos de lenguaje y mejorar su precisión.

2026-06-17 · 1 min

Momentum para razonamiento: Señales intrínsecas densas en optimización

Descubre cómo ISPO mejora el razonamiento en LLMs con señales intrínsecas, superando fallos de GRPO como colapso y certeza alucinada.

2026-06-17 · 2 min

Razonamiento conforme en inferencia con control de factualidad para LLMs

Descubre cómo el razonamiento conforme en tiempo de inferencia garantiza la factualidad en LLMs, mejorando la precisión en tareas de razonamiento multi-paso.

2026-06-17 · 2 min

Más allá de la tasa de aprobación: evaluación multilingüe de LLMs de código abierto

Descubre cómo los modelos de código abierto se desempeñan en 12 lenguajes de programación. Analizamos fallos, tasas de aprobación y más en esta evaluación

2026-06-17 · 1 min

ZIPP: Personalización zero-shot de imágenes con personas

Descubre ZIPP: personalización zero-shot de imágenes con IA usando descripciones de tu personalidad. Supera a métodos tradicionales con un 79% de preferencia.

2026-06-17 · 3 min

Calificación semiautomática de exámenes escritos en papel en educación superior

La IA y modelos de lenguaje con visión permiten calificar semiautomáticamente exámenes escritos a mano, mejorando validez y escalabilidad.

2026-06-17 · 1 min

¿Puede el entorno hablar? T²-GRPO en cuidado de demencia

Descubre cómo T²-GRPO optimiza agentes cuidadores con recompensas del entorno, mejorando la atención en demencia con seguridad y eficiencia.

2026-06-17 · 2 min

AlloSpatial: Marco Agéntico para Razonamiento Espacial en Modelos Fundacionales

Descubre AlloSpatial, un marco innovador que mejora el razonamiento espacial en modelos de IA hasta un 18%. En benchmarks como VSI-Bench y MindCube. ¡Lee más!

2026-06-17 · 2 min

Router Efectivo para Seleccionar Modelos Visión-Lenguaje

ARMS: el router que elige el VLM ideal. Ahorra recursos y mejora resultados con nuestro innovador método de entrenamiento. ¡Conócelo!

2026-06-17 · 1 min

Diversidad en esquemas de pensamiento mejora el razonamiento en LLMs

Descubre cómo la diversidad en esquemas de pensamiento mejora el razonamiento de los LLMs. DiScO optimiza políticas para resultados más precisos y recuperación

2026-06-17 · 3 min

Ojalá hubiera sabido antes sobre la latencia de DeepSeek V4 Flash

Descubre cómo un CTO redujo un 58% en costos de inferencia al migrar a DeepSeek V4 Flash. Análisis de latencia, benchmarks y código de implementación.

2026-06-17 · 2 min

Los modelos de IA peligrosos llegarán de todos modos

Pese a la represión de Anthropic, modelos de IA peligrosos con capacidades de hacking avanzado son inevitables. Conoce los detalles.

2026-06-17 · 2 min

Graph2Idea: generación de ideas científicas con grafos de conocimiento

Descubre cómo Graph2Idea usa grafos de conocimiento para generar ideas científicas novedosas, viables y de alta calidad, superando métodos tradicionales.

2026-06-16 · 2 min

Minimización de arrepentimiento para aprendizaje de preferencias en LLMs

RePO minimiza el arrepentimiento para mejorar el aprendizaje de preferencias en LLMs. Resultados superiores en razonamiento y preferencias humanas. ¡Descúbrelo!

2026-06-16 · 1 min

Fusión tardía de capas: solución a la saturación visual en MLLMs

Un nuevo método, DPVR-LF, enruta tokens visuales solo en la última capa, reduciendo cómputo inútil en modelos multimodales. ¡Rendimiento competitivo con solo

2026-06-16 · 2 min