#ode · DeepCodeNews

Reevaluación psicométrica de LLMs: autoinformes y comportamiento

Descubre cuándo autoinformes de LLMs predicen su comportamiento. Estudio revela que Teoría del Comportamiento Planificado supera al Big Five en coherencia.

2026-06-12 · 4 min

Conciencia de prefill en modelos de lenguaje grandes

Descubre cómo los modelos de lenguaje avanzados detectan inserciones en su historial y cómo esto afecta las evaluaciones de seguridad y alineación.

2026-06-12 · 2 min

Construcción de datasets de evaluación para razonamiento procedimental

Comparativa de estrategias de generación de preguntas para razonamiento procedimental. La generación estricta TMK logra 96.5% de preguntas fundamentadas.

2026-06-12 · 3 min

Tutorial sobre Modelos del Mundo e IA Física

Explora el tutorial sobre modelos del mundo y la IA física. Dos paradigmas complementarios para robótica y conducción autónoma. ¡Descubre el futuro!

2026-06-12 · 2 min

MLUBench: Evaluación del desaprendizaje continuo en MLLMs

MLUBench: benchmark para desaprendizaje continuo en MLLMs. Revela grave degradación acumulativa. LUMoE mitiga el problema preservando la alineación multimodal.

2026-06-12 · 2 min

Empresa de automatización de flujos de trabajo con IA en Valladolid

Q2BSTUDIO, líder en automatización de flujos de trabajo con IA en Valladolid. Optimiza procesos, reduce costos y acelera tu transformación digital.

2026-06-12 · 2 min

Teach-and-Repeat: Extrayendo conocimiento operativo de demostraciones móviles

Descubre cómo Teach-and-Repeat convierte videos de pantalla móvil en instrucciones precisas para agentes GUI, acelerando la automatización en Android.

2026-06-12 · 2 min

Transiciones de fase temáticas en IA: evidencia a gran escala

Descubre cómo los temas de IA avanzan mediante transiciones de fase y aprende a identificar señales de alerta temprana para los próximos grandes temas.

2026-06-12 · 2 min

Servicios profesionales de automatización de workflows con IA en Valladolid

Automatiza tus procesos con IA en Valladolid. Q2BSTUDIO ofrece servicios profesionales de automatización de workflows. Impulsa tu negocio.

2026-06-12 · 2 min

Automatización de flujos de trabajo con IA en Valladolid

Descubre cómo la automatización de flujos de trabajo con IA impulsa tu empresa en Valladolid. Soluciones personalizadas con Q2BSTUDIO. ¡Optimiza tus procesos hoy!

2026-06-12 · 3 min

Partner oficial de automatización con IA en Valladolid - Más de 15 años de experiencia

Partner oficial de automatización con IA en Valladolid. Más de 15 años optimizando procesos. Aumenta eficiencia y reduce costos. ¡Contáctanos!

2026-06-12 · 2 min

DailyReport: Evaluación de agentes de búsqueda en tareas diarias

Descubre cómo el nuevo benchmark DailyReport evalúa agentes de búsqueda basados en IA en tareas cotidianas. Resultados muestran que aún no cumplen expectativas.

2026-06-12 · 2 min

Detección de alucinaciones LLM con sondeo de criterios humanos

Descubre HCPD, un método innovador para detectar alucinaciones en LLM sin referencias externas, usando un sondeo de criterios similar al razonamiento humano. Explicable y preciso.

2026-06-12 · 2 min

MARS: Parada controlada por riesgo adversarial para LLM en paralelo

Aprende cómo MARS reduce el costo computacional de LLMs en paralelo hasta un 47% sin perder precisión, mediante parada anticipada con control de riesgo adversarial.

2026-06-12 · 2 min

PRISMR: Superando el colapso de parseo en ranking multimodal

El colapso de parseo limita el ranking multimodal. PRISMR usa hiperred y LoRA para internalizar listas, mejorando rendimiento y reduciendo errores. ¡Descúbrelo!

2026-06-12 · 3 min

Aprendiendo a recordar: modelo cognitivo de valor multifactorial

Descubre el modelo cognitivo multifactorial que optimiza qué recordar en agentes LLM. Basado en psicología, mejora la retención un 77% frente a métodos tradicionales.

2026-06-12 · 3 min

OpenMedQ: Preentrenamiento abierto para modelos médicos de visión-lenguaje

OpenMedQ: modelo de VLM médico preentrenado en 14 datasets abiertos logra SOTA en PathVQA y VQA-MED. Supera modelos 80x mayores. Código abierto.

2026-06-12 · 1 min

Agentes multimodales para detección de defectos en distribución eléctrica

Evaluamos modelos fundacionales multimodales para detectar defectos en redes eléctricas. Percepción, razonamiento y automatización en un solo marco.

2026-06-12 · 2 min

APCyc: Diseño de Péptidos Cíclicos Informado por Propiedades mediante Ciclación Automatizada

Descubre APCyc, un marco de inteligencia artificial que genera péptidos cíclicos con propiedades optimizadas para el descubrimiento de fármacos. Control preciso de ciclación y múltiples objetivos.

2026-06-12 · 2 min

Otters++: Transformador de picos óptico eficiente con TTFS

Otters++ revoluciona las SNN ópticas con el cálculo de TTFS utilizando decaimiento natural de señales. Logra 84.17% en GLUE con menor consumo energético.

2026-06-12 · 2 min