#delos

ProcessThinker: mejora el razonamiento multimodal con recompensas de proceso

ProcessThinker mejora el razonamiento multimodal mediante recompensas de proceso paso a paso, sin entrenar un PRM. Supera en benchmarks de video.

2026-06-11 · 2 min

T2MM: Arquitectura con LLM para modelado por indagación

Descubre T2MM, una arquitectura que integra LLMs para crear modelos interactivos en VERA, mejorando el aprendizaje científico por indagación.

2026-06-11 · 2 min

¿Cuándo contratar un socio de software a medida ayuda a predecir tendencias?

Descubre cuándo contratar un socio de software a medida para predecir tendencias. Anticipa demanda, reduce riesgos y toma decisiones con análisis predictivo.

2026-06-11 · 2 min

Costo ambiental de los LLM en IA Educativa: informes y prácticas

Descubre el costo ambiental oculto de los LLM en la IA educativa y cómo medir y reportar su huella de carbono con métodos estandarizados.

2026-06-11 · 2 min

Cuándo contratar un socio de software y cómo los datos mejoran resultados

Descubre cuándo es el momento óptimo para contratar un socio de software personalizado y cómo los datos impulsan mejoras medibles en tu negocio.

2026-06-11 · 3 min

Prerregistro en experimentos con agentes de IA

Descubre por qué el prerregistro es clave para la credibilidad en experimentos con agentes de IA. Nuevas prácticas metodológicas que garantizan resultados reproducibles.

2026-06-11 · 2 min

Afrispeech Semantics: Evaluación del razonamiento semántico en audio

Descubre cómo los modelos de lenguaje de audio manejan el razonamiento semántico en distintos acentos y dominios. Evaluación de Afrispeech Semantics.

2026-06-11 · 2 min

Cada acto tiene su precio: Composición moral comprimida en LLMs de frontera

Descubre cómo los LLMs de frontera componen señales morales comprimidas con el benchmark Moral Trolley Arena. Resultados sobre ética en IA.

2026-06-11 · 2 min

IA en Financiamiento Naval: Aplicaciones, Oportunidades y Caso Práctico

Descubre cómo la IA y LLMs revolucionan el financiamiento de buques: aplicaciones, oportunidades y un caso práctico de originación automatizada de préstamos.

2026-06-11 · 2 min

SPEAR: Recuperación adaptativa post-cuantización para servir LLMs eficientes

Descubre cómo SPEAR recupera hasta 75% de la brecha de calidad en cuantización de LLMs, con mínimo overhead y latencia estable. Ideal para despliegues eficientes.

2026-06-11 · 2 min

IA generativa con restricciones físicas en semiconductores

Descubre cómo la IA generativa respeta leyes físicas en la fabricación de chips. Métodos que integran restricciones por construcción, no por filtrado posterior.

2026-06-11 · 2 min

RAIL: Benchmark Cognitivo de Inteligencia Auditiva en LALMs

RAIL es un benchmark cognitivo CHC para evaluar inteligencia auditiva en modelos de audio-lenguaje. Revela diferencias en percepción, razonamiento y memoria.

2026-06-11 · 2 min

PermDoRA: Límites de la geometría en interferencia de adaptadores

La geometría del espacio de parámetros no predice la interferencia al combinar adaptadores en LLMs. Análisis con DoRA-RBAC y benchmarks de QA.

2026-06-11 · 2 min

Por qué el envenenamiento de corpus en RAG falla tras la recuperación

Descubre por qué los ataques de envenenamiento de corpus fallan en sistemas RAG reales con chunking y reranking. Conoce CRCP, un nuevo enfoque para ataques robustos. ¡Lee más!

2026-06-11 · 3 min

Cuantificando la transferencia subliminal en destilación de modelos

Un nuevo estudio cuantifica la transferencia subliminal al destilar modelos de lenguaje. Llama-2 y Qwen2.5 muestran patrones distintos.

2026-06-11 · 2 min

RoVE: Embeddings Rotatorios de Valor para Atención Posicional

Descubre RoVE: mejora la atención de transformers haciendo que los valores sean sensibles a la posición, mejorando precisión en contextos largos.

2026-06-11 · 2 min

FreeBridge: Puentes Variacionales de Schrödinger para Dinámica Celular

Descubre cómo FreeBridge, un modelo basado en puentes de Schrödinger, infiere trayectorias continuas de células a partir de imágenes fijas, mejorando la interpretabilidad biológica.

2026-06-11 · 2 min

FlowBank: Optimización de flujos de trabajo agénticos por precómputo y reúso

FlowBank optimiza flujos de trabajo agénticos con precómputo y reúso, seleccionando el mejor flujo para cada consulta. Mejora rendimiento y reduce costos.

2026-06-11 · 2 min

Embodied-R1.5: Inteligencia física evolutiva con modelos encarnados

Embodied-R1.5: supera a GPT-5.4 en benchmarks robóticos. Con solo 8B parámetros, logra planificación y autocorrección en robots reales. Código abierto.

2026-06-11 · 1 min

Lenguaje humano vs IA: fluctuación semántica en escalas temporales

Descubre cómo las escalas semánticas revelan diferencias en el lenguaje humano vs IA. Una nueva métrica para analizar especificidad.

2026-06-11 · 2 min