#eps · DeepCodeNews

Anatomía completa del razonamiento matemático humano y de DeepSeek-R1

Un estudio exhaustivo compara el razonamiento humano con el de DeepSeek-R1 en 30 problemas de AIME 2025, revelando diferencias estructurales y señales de razonamiento genuino.

2026-06-08 · 2 min

Razonamiento unificado en IA: un parámetro para todos los proveedores

Descubre cómo aichain unifica los parámetros de razonamiento de 6 proveedores en uno solo. Ahorra costos y simplifica tu código.

2026-06-07 · 3 min

Goedel-Architect: Optimizando la demostración formal con planos

Descubre Goedel-Architect, el marco agéntico que revoluciona la demostración formal en Lean 4. Alcanza un 99.2% en MiniF2F y 75.6% en PutnamBench. Ahorra hasta 500x en costos.

2026-06-06 · 2 min

Accede a modelos DeepSeek fácilmente con ccswitch-deepseek

Accede a modelos DeepSeek sin límites de API ni configuraciones complejas. ccswitch-deepseek ofrece reenvío rápido y fiable. ¡Pruébalo gratis!

2026-06-06 · 2 min

Predicción Temprana de Sepsis Multicéntrica: Aprendizaje Federado con Privacidad

Descubre cómo el aprendizaje federado predice sepsis en múltiples centros sin comprometer la privacidad. Estudio real con 648 pacientes.

2026-06-04 · 2 min

Optimización minimax guiada por literatura para neuroestimulación en epilepsia

Descubre cómo la literatura guía la optimización minimax para neuroestimulación en epilepsia, mejorando el peor caso un 39.8% con simulaciones.

2026-06-04 · 2 min

Aprendizaje Guiado por Grafos con Universum en GEPSVM para Alzheimer

Aprendizaje guiado por grafos con Universum mejora clasificación Alzheimer. Los modelos GEPSVM alcanzan 88% AUC en datos ADNI, superando métodos previos.

2026-06-04 · 1 min

¿Quién usa los modelos de IA más potentes? La crisis de gobernanza ignorada

El nuevo modelo Mythos de Anthropic es parte del 'encierro de IA' que limita el acceso a los más potentes. ¿Solución? Alternativas abiertas como DeepSeek-V3.

2026-06-04 · 2 min

DeepSpeak-Agentic: Conversaciones humano-IA para identificación forense

Descubre el dataset DeepSpeak-Agentic: 37 horas de conversaciones humano-IA para identificar agentes mediante audio, video y texto.

2026-06-03 · 2 min

Pruebas de razonamiento aritmético en LLMs con ataques de reasignación numérica

Descubre cómo los LLMs fallan ante cambios numéricos mínimos en problemas aritméticos. Nuevos ataques automáticos revelan fragilidades en razonamiento.

2026-06-03 · 3 min

Backlog de la NVD: síntoma del problema de escala en ciberseguridad

El backlog de la NVD supera 27,000 vulnerabilidades sin procesar. Descubre cómo adaptar la gestión de vulnerabilidades a un ritmo insostenible.

2026-06-03 · 2 min

FlashMLA-ETAP: Pipeline de atención transpuesta eficiente para MLA en NVIDIA H20

FlashMLA-ETAP acelera hasta 2.78x la inferencia de DeepSeek-R1 en GPUs H20, con menor error y mayor eficiencia. ¡Optimiza tu modelo ahora!

2026-06-03 · 1 min

InftyThink+: Razonamiento eficiente en horizonte infinito con RL

Optimiza el razonamiento infinito-horizonte con InftyThink+ usando RL. Mejora precisión y eficiencia, superando limitaciones del chain-of-thought.

2026-06-03 · 1 min

Heterogeneidad cognitiva y sesgos en cadenas de suministro con LLM

La heterogeneidad cognitiva en LLM (DeepSeek, GPT) afecta cadenas de suministro. La simulación revela sesgos y cómo compartir información mitiga ineficiencias.

2026-06-03 · 2 min

VistaHop: Evaluando razonamiento multi-salto para Visual DeepSearch

Descubre VistaHop, el benchmark que evalúa el razonamiento visual multi-salto. Solo el 24% de aciertos revela grandes desafíos para la IA.

2026-06-03 · 2 min