#ciencia computacional

Poda de redes neuronales profundas mediante la distribución de Marchenko-Pastur

Poda de redes profundas con distribución Marchenko-Pastur: precisión mantenida con mínimo ajuste fino. Resultados en ImageNet con ViT y CNNs.

2026-06-03 · 3 min

Localidad no implica accesibilidad: reparación de bordes en atención causal

Descubre cómo la atención causal dispersa por bloques puede desconectar tokens adyacentes y cómo reparar los bordes con una solución eficiente.

2026-06-03 · 2 min

Algoritmo multifidelidad adaptativo para aprendizaje automático eficiente

Descubre cómo nuestro algoritmo adaptativo multifidelidad reduce hasta 30 veces los costos de generación de datos en química cuántica, mejorando la eficiencia del machine learning.

2026-06-03 · 3 min

Optimización eficiente de hiperparámetros para RL en LLMs

Descubre cómo JF-HPO optimiza hiperparámetros en RL para LLMs, logrando hasta 14.9x más eficiencia y mejoras de rendimiento del 5.8% al 111.6%.

2026-06-03 · 1 min

SLAT: Recorte Adaptativo de Segmentos en Razonamiento CoT

SLAT: recorte adaptativo por segmentos reduce un 50% la longitud del razonamiento CoT sin perder precisión.

2026-06-03 · 1 min

Poda de redes neuronales post-entrenamiento con curvatura de grafos

Descubre cómo la curvatura de grafos permite podar redes neuronales sin perder precisión. Técnica innovadora basada en Ollivier-Ricci para identificar conexiones clave.

2026-06-03 · 2 min

L2G-Net: Redes de grafos espectrales local-global con factorización Cauchy

Descubre cómo L2G-Net revoluciona las GNN espectrales con factorizaciones de Cauchy, escalando a grafos grandes con pocos parámetros.

2026-06-03 · 2 min

MENO: Operadores Neurales Mejorados con MeanFlow para Sistemas Dinámicos

Descubre MENO: el nuevo marco que mejora operadores neurales con MeanFlow para predicciones precisas en sistemas dinámicos, con hasta 14x más rapidez que DDIM.

2026-06-03 · 3 min

IAPO: Optimización de Políticas Informada para Razonamiento Eficiente en Tokens

Descubre IAPO: asigna ventajas a cada token según información mutua. Reduce razonamiento hasta 36% sin perder precisión. Optimiza tus modelos de lenguaje.

2026-06-03 · 2 min

PECKER: Borrado eficiente de conocimiento en modelos de difusión

PECKER: método eficiente de desaprendizaje para modelos de difusión. Reduce el tiempo de entrenamiento y mejora el borrado selectivo de conocimiento.

2026-06-03 · 1 min

MAVEN-T: Predicción Multiagente con Destilación Reforzada

Descubre MAVEN-T, un innovador marco de destilación reforzada que logra predicción de trayectorias multiagente en tiempo real con 6.2x menos parámetros y 3.7x más velocidad en Jetson Orin.

2026-06-03 · 2 min

Muestreo ponderado eficiente con modelos generativos basados en puntuación

Descubre cómo el muestreo ponderado eficiente con modelos generativos de puntuación logra aceleraciones de 1.2x a 4.7x sin entrenamiento adicional, ideal para IA generativa.

2026-06-03 · 2 min

Moderación eficiente de LLMs con prototipos latentes multicapa

MLPM, moderador ligero basado en prototipos latentes multicapa, mejora la seguridad de LLMs sin sacrificar eficiencia. Ideal para despliegues personalizados.

2026-06-03 · 1 min

Paralelismo de Modelos con Subredes de Datos

Descubre cómo el Subnetwork Data Parallelism reduce el uso de memoria en un 28-60% al entrenar modelos de IA, manteniendo el rendimiento. ¡Optimiza tu entrenamiento distribuido!

2026-06-02 · 2 min

Hacia un modelo fundacional de física

Descubre GPhyT, el primer modelo fundacional de física que aprende dinámicas complejas sin ecuaciones, superando a arquitecturas especializadas en múltiples dominios.

2026-06-02 · 2 min

El razonamiento latente en TRMs es un operador de mejora de política

En TRMs, el razonamiento latente actúa como operador de mejora de política. Con RL y difusión, reducimos 18x los pasos.

2026-06-02 · 2 min

C-GSPN: Nuevo codificador de visión a escala fundacional

C-GSPN: codificador de visión que iguala a ViT con 15% menos parámetros, mejora segmentación +2.1% y ofrece 4x de aceleración. ¡Conócelo!

2026-06-02 · 3 min

SyNGLER: generación eficiente de redes sintéticas

Descubre SyNGLER, un marco eficiente para generar redes sintéticas realistas preservando esparcidad y grado de nodos. Bajo costo computacional.

2026-06-02 · 1 min

Algoritmo óptimo para bandits contextuales lineales con actualizaciones escasas

Descubre un algoritmo práctico y óptimo para bandits contextuales lineales con O(log log T) actualizaciones. Máximo rendimiento con mínima complejidad.

2026-06-02 · 2 min

Rendir más con menos: Muestreo para pérdida por pares

Descubre cómo el muestreo directo de pares reduce costos computacionales en pérdida por pares, manteniendo precisión. Técnicas basadas en teoría de encuestas para IA escalable.

2026-06-02 · 2 min