#f1 · DeepCodeNews

STaR-DRO: Reponderación Tsallis para predicción estructurada robusta a grupos

STaR-DRO optimiza la predicción estructurada con LLMs, mejorando el F1 en +14.46 y reduciendo la pérdida grupal. Descubre cómo supera al DRO tradicional.

2026-06-15 · 2 min

HybridCodeAuthorship: benchmark para detectar autoría de código IA

¿Código generado por IA en tu repositorio? HybridCodeAuthorship es el benchmark definitivo para detectarlo. ¡Descubre cómo!

2026-06-12 · 2 min

HalluJudge: Detección de Alucinaciones sin Referencia para Revisiones de Código

HalluJudge detecta alucinaciones en revisiones de código con IA. Con F1 de 0.85 y bajo coste, alinea con preferencias de desarrolladores. ¡Mejora la confianza!

2026-06-12 · 2 min

Mejora en la Detección de Nodos Raros en Aprendizaje Jerárquico Multi-etiqueta

Mejora la detección de nodos raros en clasificación jerárquica multi-etiqueta con pérdida ponderada. Aumenta el recall hasta 5x y optimiza tus modelos.

2026-06-11 · 1 min

Expansión de atención: mejora la extracción de frases clave en documentos largos

Mejora la extracción de frases clave en documentos largos con expansión de atención. Resultados F1 superiores sin LLMs costosos.

2026-06-10 · 2 min

Fusión combinatoria en validación para detectar fraudes desbalanceados

Mejora la detección de fraudes con CFA: supera modelos individuales en AUC-ROC, AUPRC y F1. Ideal para datos desbalanceados.

2026-06-10 · 2 min

Brecha modal en HAR ZSL: entrenamiento contrastivo y prototipos optimizados

Alinea sensores IMU y texto con entrenamiento contrastivo y prototipos optimizados para lograr 73% de precisión en HAR zero-shot.

2026-06-10 · 2 min

Marco de evaluación y comparación de métodos de detección de deriva de conceptos

Marco de evaluación para detección de deriva de conceptos. Nuevas métricas y protocolos. Resultados de benchmark en 7 datasets.

2026-06-09 · 1 min

Equilibrio de datos reales y sintéticos para detección de grietas en mampostería con CNN

Descubre cómo combinar datos sintéticos con solo un 20% de datos reales iguala y mejora la detección de grietas en mampostería con CNN. ¡Resultados sorprendentes!

2026-06-09 · 2 min

Predicción de abandono de clientes con FT-Transformer y stacking

Descubre cómo combinar FT-Transformer y XGBoost con stacking para predecir el abandono de clientes en datos estructurados con alta precisión.

2026-06-09 · 3 min

Atención de rama específica por clase en desequilibrio

Descubre cómo la atención de rama reduce la interferencia de gradiente, mejorando el F1 de clases minoritarias de 0.261 a 0.522 en desequilibrio severo.

2026-06-06 · 2 min

Más allá de la similitud vectorial: análisis estructural de recuperación aumentada con grafos

Ocho arquitecturas de recuperación en grafos: el razonamiento estructural requiere operadores específicos, más allá de la similitud vectorial.

2026-06-06 · 3 min

Trans GAN-WT: detección anómala con extracción de características y aprendizaje interactivo

El modelo TransGAN-WT combina Transformer y GAN para detectar anomalías en turbinas eólicas con F1 del 96.1% y FPR del 0.06%. Optimiza el mantenimiento predictivo.

2026-06-03 · 2 min

La selección adaptativa mejora la predicción en wearables con bajo rendimiento

Descubre cómo la selección adaptativa de datos mejora la predicción en wearables, especialmente con bajo rendimiento base. Ganancia de hasta 0.7 en AUROC.

2026-06-02 · 2 min

SPADER: Recompensas de Exploración con Diversidad para QA Multi-Respuesta

SPADER utiliza aprendizaje por refuerzo con recompensas de exploración diversa para mejorar el recuerdo y F1 en QA multi-respuesta.

2026-06-02 · 2 min

SPM-Bench: Benchmark para LLMs en microscopía de sonda

SPM-Bench: Benchmark automatizado que evalúa LLMs en microscopía de sonda. Descubre su pipeline AGS y la métrica SIP-F1 que revela la personalidad de la IA.

2026-06-01 · 2 min