#lela

Portafolios de Recuperadores: Enfoque Principiado para RAG Adaptativo

Descubre cómo los portafolios de recuperadores optimizan RAG: selección automática de múltiples recuperadores para mejorar precisión y reducir latencia en QA.

2026-06-01 · 2 min

Modelado Generativo Enmascarado de Punto Fijo

Descubre cómo FP-MGMs y CoFRe reducen parámetros y costo de entrenamiento en modelos generativos enmascarados, mejorando calidad con menos recursos.

2026-06-01 · 2 min

Evita el vaivén: Verificación con preservación de contexto

Descubre COVER: verificación eficiente que elimina oscilaciones y acelera la inferencia en decodificación difusiva revocable.

2026-06-01 · 2 min

Diversificación sin anclaje para la ideación paralela de LLM

2026-05-30 · 2 min

Decodificación paralela guiada por atención a nivel de clúster para modelos de lenguaje de difusión enmascarados

Decodificación paralela guiada por atención de clúster optimiza modelos de difusión enmascarados para generación eficiente.

2026-05-29 · 3 min

Conoce mKernel: Una biblioteca de kernels fusionados multi-GPU y multi-nodo para comunicación impulsada por GPU

2026-05-29 · 4 min

ScheduleStream: Planificación Temporal con Muestreadores para la Planificación y Programación de Tareas y Movimientos de Múltiples Brazos Acelerada por GPU

Descubre cómo la aceleración por GPU optimiza la planificación temporal para múltiples brazos robóticos, mejorando la eficiencia y el rendimiento en sistemas complejos.

2026-05-29 · 2 min

Aprender cuándo optimizar: Habilidades de optimización verificadas de linajes expertos de kernels de GPU

Aprende cuándo optimizar kernels de GPU con métodos expertos para maximizar el rendimiento y eficiencia de tus aplicaciones

2026-05-29 · 2 min

Ariel-ML: Paralelización de cómputo con Rust embebido para redes neuronales en microcontroladores multinúcleo heterogéneos

Descubre Ariel-ML, un framework en Rust embebido para redes neuronales paralelas en microcontroladores multinúcleo.

2026-05-28 · 2 min

MobileGym: Una plataforma de simulación verificable y altamente paralela para la investigación de agentes GUI móviles

#lela

Portafolios de Recuperadores: Enfoque Principiado para RAG Adaptativo

Modelado Generativo Enmascarado de Punto Fijo

Evita el vaivén: Verificación con preservación de contexto

Diversificación sin anclaje para la ideación paralela de LLM

Decodificación paralela guiada por atención a nivel de clúster para modelos de lenguaje de difusión enmascarados

Conoce mKernel: Una biblioteca de kernels fusionados multi-GPU y multi-nodo para comunicación impulsada por GPU

ScheduleStream: Planificación Temporal con Muestreadores para la Planificación y Programación de Tareas y Movimientos de Múltiples Brazos Acelerada por GPU

Aprender cuándo optimizar: Habilidades de optimización verificadas de linajes expertos de kernels de GPU

Ariel-ML: Paralelización de cómputo con Rust embebido para redes neuronales en microcontroladores multinúcleo heterogéneos

MobileGym: Una plataforma de simulación verificable y altamente paralela para la investigación de agentes GUI móviles

Hacia decisiones de retroalimentación a plan para agentes LLM auto-evolutivos en la generación de kernels CUDA

LELA: Un marco de vinculación de entidades basado en LLM de extremo a extremo con adaptación de dominio zero-shot

Cómo ejecutar eficazmente muchas sesiones de Claude Code en paralelo

LocateAnything: Anclaje visión-lenguaje rápido y de alta calidad con decodificación paralela de cajas

CreditDecoding: Acelerando la Decodificación Paralela en Modelos de Lenguaje Grande de Difusión con Crédito de Traza