#osi · DeepCodeNews

IAPO: Optimización de Políticas Informada para Razonamiento Eficiente en Tokens

Descubre IAPO: asigna ventajas a cada token según información mutua. Reduce razonamiento hasta 36% sin perder precisión. Optimiza tus modelos de lenguaje.

2026-06-03 · 2 min

El grupo de referencia invierte conclusiones en Oaxaca-Blinder

Descubre cómo la elección del grupo de referencia en la descomposición Oaxaca-Blinder puede revertir conclusiones clave. Aprende a evitar errores y mejorar tu análisis.

2026-06-03 · 2 min

Benchmark de inferencia sin verosimilitud: redes neuronales y transporte óptimo

¿Cuál es el mejor método de inferencia sin verosimilitud? Comparamos redes neuronales y transporte óptimo en datos extremos y discretos.

2026-06-03 · 2 min

Carrera contra el tiempo: alertas rápidas de vulnerabilidades

Aprende cómo las alertas rápidas de vulnerabilidades de SecAlerts acortan los tiempos de respuesta y reducen el riesgo de explotación.

2026-06-03 · 2 min

Dragos adquiere la firma de seguridad xIoT Phosphorus

Dragos adquiere Phosphorus para reforzar la seguridad de dispositivos IoT. Clientes obtendrán visibilidad ampliada, inteligencia integrada y flujos de remediación automatizados.

2026-06-03 · 2 min

Colapso de caminos generativos: criterio y corrección para difusión

El colapso de caminos marginales afecta la composición de expertos en difusión. Conoce el criterio de existencia y la corrección ACE para estabilizar la generación.

2026-06-03 · 2 min

KnowledgeBerg: cobertura sistemática y razonamiento composicional en LLMs

KnowledgeBerg: benchmark que evalúa cobertura sistemática y razonamiento composicional en LLMs. Resultados clave sobre sus limitaciones.

2026-06-03 · 2 min

Agentes de IA en una placa de seguridad: Microsoft Project Solara

Descubre Project Solara, la plataforma de Microsoft que integra agentes de IA en dispositivos como credenciales de seguridad. ¿El futuro del trabajo?

2026-06-03 · 2 min

5 formas de reutilizar un Galaxy Watch antiguo

¿Tienes un Galaxy Watch viejo? No lo guardes. Descubre 5 formas creativas de reutilizarlo y darle una segunda vida. Ahorra dinero y sé ecológico.

2026-06-03 · 1 min

Parche de seguridad Android junio: instálalo ya

Google lanza el parche de seguridad de junio corrigiendo 124 fallos, incluido un zero-day crítico (CVE-2025-48595). Instálalo ya para proteger tu dispositivo Android.

2026-06-03 · 2 min

GFlowGR: Optimización de Sistemas de Recomendación Generativos con GFlowNets

GFlowGR utiliza GFlowNets para ajustar sistemas de recomendación, mitigando el sesgo de exposición. Mejora diversidad y precisión. Optimiza tu modelo.

2026-06-02 · 1 min

Aprendizaje profundo extremo a extremo para predecir salidas en espacios métricos

E2M revoluciona la predicción de datos no euclidianos con deep learning. Conoce su teoría, rendimiento y aplicaciones en mortalidad y tráfico.

2026-06-02 · 2 min

Evaluación de afirmaciones de colapso recursivo bajo control de FP

Nuevo benchmark Loopzero revela cómo evaluar advertencias de colapso recursivo con control de falsos positivos. ¿Funciona? Resultados sorprendentes.

2026-06-02 · 1 min

Difusión composicional de grueso a fino para planificación a largo plazo

CoFi mejora la planificación a largo plazo con difusión composicional. Hasta 8 veces menos evaluaciones. Ideal para robótica, video e imágenes.

2026-06-02 · 1 min

Acelerando la inversión de ondas con redes híbridas cuántico-clásicas

Acelera la inversión de ondas con redes híbridas cuántico-clásicas: errores más bajos en 8x menos iteraciones y menos parámetros.

2026-06-02 · 3 min

Uso de computación multi-agente

Descubre cómo los sistemas multi-agente mejoran el rendimiento en tareas complejas de navegación web y escritorio, superando a los agentes individuales en un 25%.

2026-06-02 · 2 min

Aprendizaje Equivariante con Desenredo para VQA Compositivo

El nuevo marco DEAL mejora la respuesta visual a preguntas compositivas usando desenredo causal y equivarianza. Resultados superiores en CLEVR y GQA.

2026-06-02 · 2 min

Aprendizaje off-policy: optimización > estimación en grandes acciones

Descubre por qué la optimización es clave en el aprendizaje off-policy con grandes espacios de acción, y cómo los pesos de verosimilitud simplifican el proceso.

2026-06-02 · 3 min

Exploración de diseño de superposición granular de cómputo y comunicación basada en DMA

La superposición granular de cómputo y comunicación con DMA acelera hasta 1.6x el entrenamiento ML en GPUs. Heurísticas precisas para elegir el plan óptimo.

2026-06-02 · 2 min

Pruebas privadas casi óptimas para hipótesis simples y MLR

Descubre pruebas privadas casi óptimas para hipótesis simples y MLR con privacidad diferencial gaussiana. Resultados comparables a pruebas no privadas.

2026-06-02 · 2 min