#profunda

PC Layer: Preacondicionamiento de Pesos Polinomial para Mejorar el Pre-entrenamiento de LLMs

La capa PC estabiliza el espectro de valores singulares en LLMs, mejorando convergencia sin overhead de inferencia. Optimiza tu pre-entrenamiento.

2026-06-05 · 2 min

Aprendizaje resistente al ruido de etiquetas con máscara de daño cerebral óptimo

Enmascaramiento selectivo de bordes basado en OBD intercepta gradientes ruidosos y mejora robustez frente a etiquetas ruidosas. Plug-and-play superior.

2026-06-05 · 2 min

Mitigando la maldición de la dimensionalidad con activaciones suaves

Aprende cómo las redes neuronales con activaciones suaves mitigan la maldición de la dimensionalidad, garantizando convergencia uniforme y robustez en regresión. ¡Entra!

2026-06-05 · 1 min

Leyes de escalado espectral de Muon

Descubre las leyes de escalado espectral de Muon: cómo las iteraciones Newton-Schulz afectan el entrenamiento de LLMs. Ahorra cómputo sin sacrificar calidad.

2026-06-04 · 1 min

Control de FDR con knockoffs en redes neuronales profundas

Descubre cómo los métodos knockoff controlan la tasa de falsos descubrimientos en redes profundas, simplificando modelos sin perder precisión.

2026-06-04 · 2 min

Control de falsos descubrimientos y simplificación en DNN con knockoffs

Descubre cómo los métodos knockoff permiten seleccionar variables relevantes en redes neuronales profundas, reduciendo la complejidad y manteniendo el control de falsos descubrimientos.

2026-06-04 · 2 min

Selección de rasgos radiomicos vía gradiente de red para cáncer de pulmón

Descubre cómo el método GL-RFE selecciona las características radiomicas más relevantes para detectar el estadio del cáncer de pulmón con un 90% de precisión.

2026-06-04 · 2 min

Generación de pruebas basada en anclajes latentes para redes neuronales profundas

Descubre cómo Latte, un framework de pruebas de caja negra, genera casos de prueba diversos y semánticamente cercanos para detectar fallos en redes neuronales profundas.

2026-06-04 · 3 min

Selección precisa de modelos en adaptación profunda no supervisada de dominio

DEV ofrece selección precisa de modelos en UDA sin sesgo. Descubre cómo mejora la validación y estandariza la comparación de algoritmos.

2026-06-04 · 1 min

DeepMDMD: Aprendizaje Koopman con preservación algebraica

Explora DeepMDMD, un método de aprendizaje profundo que preserva el álgebra de Koopman, reduciendo contaminación espectral y logrando predicciones estables en s

2026-06-04 · 2 min

Escala de datos, complejidad y modalidades en generalización visual

Aprende cómo escala de datos, complejidad y modalidades afectan la generalización visual en IA. Resultados clave de un estudio empírico.

2026-06-04 · 2 min

Investigación profunda auto-evolutiva mediante generación y evaluación conjunta

Aprende cómo el marco SCORE mejora informes de investigación mediante la co-evolución de generación y evaluación, superando recompensas fijas.

2026-06-04 · 1 min

Inicialización Óptima en Redes Profundas: Lyapunov y Leaky ReLU

Descubre la inicialización Lyapunov para redes Leaky ReLU: cómo lograr estabilidad en activaciones y mejorar el aprendizaje en redes profundas.

2026-06-03 · 2 min

Tasas óptimas de generalización del descenso de gradiente en clasificación ReLU profunda

Descubre cómo el descenso de gradiente logra tasas de generalización óptimas en redes ReLU profundas con dependencia polinomial de la profundidad, mejorando resultados previos.

2026-06-03 · 2 min

Poda de redes neuronales profundas mediante la distribución de Marchenko-Pastur

Poda de redes profundas con distribución Marchenko-Pastur: precisión mantenida con mínimo ajuste fino. Resultados en ImageNet con ViT y CNNs.

2026-06-03 · 3 min

PhotoCraft: Razonamiento Agentivo con Memoria Jerárquica para Búsqueda Visual

Descubre PhotoCraft, un sistema de memoria jerárquica que potencia la búsqueda de imágenes con razonamiento agentivo, logrando mejoras de 18.5% en precisión.

2026-06-03 · 2 min

AdaCoM: Gestión adaptativa de contexto para agentes LLM

Descubre AdaCoM, un método de gestión de contexto adaptativo que mejora el rendimiento de agentes LLM en tareas largas, preservando restricciones y comprimiendo contenido obsoleto.

2026-06-03 · 3 min

Investigación Profunda con DecomposeR: RL y Recompensa Estructural

DecomposeR optimiza la investigación profunda con RL centrado en planificador y recompensa estructural. Mejora hasta 8 puntos en benchmarks.

2026-06-03 · 2 min

De diagnóstico interno a auditoría externa: defensa contra backdoors con VLM

Conoce PRISM, un marco basado en VLMs que cambia el diagnóstico interno por auditoría externa para neutralizar backdoors con tasa de éxito menor al 1%.

2026-06-03 · 2 min

Las redes equivariantes identificables son equivariantes por capas

Descubre cómo redes neuronales equivariantes identificables garantizan equivarianza por capas. Un hallazgo clave para entender simetrías en IA.

2026-06-03 · 2 min