#ode · DeepCodeNews

Skill-to-LoRA: De habilidades a comportamientos para agentes LLM

Descubre Skill-to-LoRA: convierte instrucciones de agentes LLM en módulos de comportamiento entrenables, mejorando precisión y reduciendo tokens. Optimiza tus

2026-06-16 · 2 min

OpenClaw-Skill: Búsqueda Colectiva en Árbol de Habilidades para LLMs

Descubre cómo OpenClaw-Skill construye un árbol de habilidades colectivas para mejorar la planificación y el uso de herramientas en LLMs agentivos. ¡Aprende

2026-06-16 · 2 min

Seguridad adaptativa: activar conciencia latente en modelos de razonamiento

Descubre cómo los modelos de razonamiento activan su conciencia de seguridad latente con SFT y DPO, reduciendo ataques hasta un 36%.

2026-06-16 · 2 min

Razonamiento de LLM con pocas etiquetas: marco semisupervisado con verificador ligero

Descubre cómo un marco semisupervisado con verificador ligero permite que los LLM aprendan a razonar con solo unas pocas etiquetas, logrando precisión

2026-06-16 · 2 min

GIST-CMTF: Inferencia de estado objetivo para filtrado de herramientas

Descubre cómo GIST-CMTF mejora la precisión de agentes LLM al inferir estados objetivo, reduciendo errores de ejecución del 19.4% al 2.5% con un 97% de éxito.

2026-06-16 · 2 min

Modelo causal de teoría de la mente en conflicto para IA

Descubre un modelo causal que explica cuándo y por qué la IA debe activar la teoría de la mente en conflictos para mejorar precisión y confianza.

2026-06-16 · 2 min

Cuando dudes, planifica: SLM comprometido para RL reactivo

PACT combina un modelo de lenguaje pequeño con RL reactivo para planificación deliberativa, superando a métodos tradicionales en entornos desafiantes.

2026-06-16 · 2 min

Inferencia y Auditorías Bayesianas en Evaluaciones Públicas de IA

Descubre cómo la inferencia bayesiana y las auditorías de decisiones permiten verificar la validez de evaluaciones públicas de modelos de IA avanzados.

2026-06-16 · 2 min

PH-KAN: Red Port-Hamiltoniana Kolmogorov-Arnold

Descubre PH-KAN: unifica redes Kolmogorov-Arnold y modelos port-Hamiltonianos para identificación de sistemas interpretable.

2026-06-16 · 2 min

MiroBench: Evaluando el realismo en simulaciones de discusiones reales con IA

Descubre MiroBench, un benchmark que evalúa si los agentes de IA replican fielmente las dinámicas de discusiones reales en Reddit. ¿Son realmente realistas?

2026-06-16 · 3 min

RAMS: Cambio de modelo condicionado por detección y recursos

RAMS optimiza la detección de objetos en el borde con cambio de modelo adaptativo. Mejora la precisión VRU un 47% bajo presión de recursos en Raspberry Pi y

2026-06-16 · 2 min

¿Tienen emociones los grandes modelos de lenguaje?

¿Los grandes modelos de lenguaje pueden tener emociones? Un estudio de Anthropic sobre Claude sugiere emociones funcionales. Analizamos la evidencia y el

2026-06-16 · 2 min

MMLongEmbed: Evaluación de modelos de embeddings multimodales en contextos largos

MMLongEmbed: el primer benchmark para evaluar modelos de embeddings multimodales en escenarios de contexto largo. Descubre sus hallazgos clave.

2026-06-16 · 1 min

¿Mis datos de visión-lenguaje entrenaron tu IA? MINT Demo 2

Descubre MINT Demo 2, una herramienta para auditar si tus datos de visión-lenguaje fueron usados en entrenar modelos de IA. Hasta 90% de precisión.

2026-06-16 · 2 min

Modelo generativo con expertos de dominio para series temporales escasas

TimeMoDE combina diffusion transformers y expertos de dominio para generar series temporales realistas con pocos datos. Supera la escasez de datos.

2026-06-16 · 2 min

¿Pueden las redes neuronales lograr el equilibrio óptimo entre cómputo y estadística?

Descubre cómo un nuevo algoritmo permite a redes neuronales de dos capas alcanzar el equilibrio óptimo entre cómputo y estadística en modelos de índice único,

2026-06-16 · 2 min

Semantic DLM+: Equilibrio sesgo-varianza en modelos de difusión

SemDLM+ mejora modelos de difusión de lenguaje al equilibrar sesgo y varianza en el diseño del kernel de transición, logrando generación de texto diversa y

2026-06-16 · 3 min

Inversión Probabilística de Signaturas Truncadas

Aprende cómo la inversión probabilística de signaturas truncadas permite recuperar caminos temporales con precisión, usando modelos de flujo y teoría de Bayes.

2026-06-16 · 1 min

DiRecT: Planificación segura con modelos de difusión y horizonte deslizante

Descubre DiRecT, un algoritmo de planificación segura sin entrenamiento que aplica restricciones solo a la trayectoria final, mejorando seguridad y rendimiento

2026-06-16 · 1 min

Robo de modelos a través del lente de la multiplicidad

Descubre cómo la multiplicidad de modelos revela que los sustitutos de alta fidelidad no son equivalentes al original, afectando seguridad y equidad.

2026-06-16 · 1 min