#peso

Optimización de despacho tripartito con RL multiagente y feedback retardado

Descubre cómo DoorDash optimiza el despacho en marketplaces tripartitos usando aprendizaje por refuerzo multiagente con feedback retardado, mejorando eficiencia sin sacrificar calidad.

2026-06-12 · 2 min

TWLA: Cuantización post-entrenamiento pesos ternarios y activaciones de bajo bit

Descubre cómo TWLA, mediante cuantización post-entrenamiento, reduce el tamaño y acelera la inferencia de LLMs usando pesos ternarios y activaciones de 4 bits.

2026-06-12 · 2 min

TWLA: Cuantización con pesos ternarios y activaciones de 4 bits

TWLA permite cuantizar LLMs a pesos ternarios y activaciones de 4 bits, reduciendo el costo de inferencia sin perder precisión.

2026-06-12 · 2 min

Diferentes capas, diferentes variedades: geometría del espacio de pesos en transformers

Descubre cómo la asignación específica de geometría de pesos (Stiefel en atención, DGram en MLP) mejora la optimización de transformers. Resultados con GPT-2.

2026-06-12 · 2 min

Poda estructurada vs no estructurada: una brecha exponencial

Un estudio revela que la poda de neuronas requiere exponencialmente más neuronas iniciales que la poda de pesos, una brecha sorprendente en el SLTH.

2026-06-12 · 1 min

DiffusionGemma: el modelo de Google que acelera la generación de texto

Descubre DiffusionGemma, el nuevo modelo de código abierto de Google que aplica difusión para generar texto hasta 4 veces más rápido en hardware local.

2026-06-12 · 2 min

¿El cardio en ayunas quema más calorías y grasa?

Descubre la verdad científica sobre el cardio en ayunas: ¿quema más grasa o es un mito? Aprende cómo afecta tu rendimiento y pérdida de peso.

2026-06-12 · 2 min

SkillOpt: optimiza habilidades de agentes de IA sin tocar pesos

Microsoft SkillOpt optimiza habilidades de agentes de IA sin modificar pesos del modelo. Mejora precisión y eficiencia con técnicas de deep learning. Open source.

2026-06-11 · 3 min

Trap²: Protección contra fusiones ilegítimas de modelos

Aprende cómo Trap² protege tus modelos de IA contra fusiones no autorizadas, degradando el rendimiento bajo reescalado sin afectar su uso legítimo.

2026-06-11 · 2 min

Modelos a prueba de fusiones gracias a un paisaje de pérdida sensible a escala

Evita que terceros fusionen tus modelos de IA sin permiso. Con Trap², proteges tus pesos durante el fine-tuning sin afectar su uso individual. Descubre cómo.

2026-06-11 · 2 min

Recuperables pero no estacionarias: estructuras lineales locales

Estructuras lineales locales en pesos y activaciones son recuperables pero evolucionan rápido, desafiando direcciones de tarea fijas. Estudio con GPT-2 y LoRA.

2026-06-10 · 1 min

Sistemas Predictivos Conformales Generalizados ante Cambios de Distribución

Descubre cómo los Sistemas Predictivos Conformales Generalizados manejan cambios de distribución, ofreciendo bandas de predicción calibradas y robustas.

2026-06-10 · 2 min

Cotas superiores para coeficientes de aprendizaje locales en redes de tres capas

Investigación presenta cotas superiores para coeficientes de aprendizaje locales en redes neuronales de tres capas, ampliando aplicaciones a funciones de activación como swish.

2026-06-10 · 2 min

QDSP: Marco interpretable para predecir muerte o parálisis cerebral en neonatos

Descubre cómo QDSP predice con alta precisión muerte o parálisis cerebral en neonatos de muy bajo peso, mejorando la toma de decisiones.

2026-06-09 · 2 min

Rompiendo la burbuja: entrenamiento asincrónico con inconsistencia acotada

Descubre PACI, un método de entrenamiento asincrónico que elimina la burbuja del pipeline sin sacrificar consistencia. Mejora la velocidad hasta 1.69x.

2026-06-09 · 3 min

Evaluando el impacto de la granularidad de tareas en el olvido catastrófico

Descubre cómo la granularidad de tareas afecta el olvido catastrófico en el aprendizaje continuo. Estudio comparativo con EWC en CIFAR-100. ¡Lee más!

2026-06-09 · 2 min

Más allá del colapso neuronal: geometría intrínseca en aritmética modular

Descubre cómo las redes neuronales organizan representaciones en aritmética modular, revelando una geometría cíclica que supera el colapso neuronal tradicional.

2026-06-09 · 3 min

BrainSurgery: Manipulaciones de pesos para edición y reciclaje

BrainSurgery: manipula pesos de modelos de IA con planes YAML declarativos. Edita, recicla y depura checkpoints de forma reproducible.

2026-06-09 · 2 min

Dinámica del aprendizaje revela jerarquía de métricas Gram inducidas por pesos

Descubre cómo la dinámica de aprendizaje revela una jerarquía de métricas Gram inducidas por pesos en redes ReLU. Optimiza tu entrenamiento profundo.

2026-06-09 · 2 min

Controladores Diferenciales sin Peso: Circuitos Lógicos para Control Continuo

Descubre cómo los Controladores Diferenciales sin Peso aprenden circuitos lógicos para control continuo eficiente, con baja latencia y mínimo consumo.

2026-06-09 · 2 min