#arquitecturas compuestas

M*: Sistema universal y eficiente para modelos multimodales

Descubre M*, el sistema de serving que reduce la latencia hasta un 20% en modelos multimodales, superando a vLLM-Omni. Ideal para arquitecturas compuestas de IA.

2026-06-12 · 1 min