Los modelos fundacionales para datos tabulares, como TabPFN, han demostrado un rendimiento excepcional en conjuntos de datos numéricos y categóricos, pero presentan limitaciones al procesar características textuales de alta cardinalidad. Tradicionalmente, se recurre a un pipeline que utiliza un modelo de lenguaje para incrustar el texto y luego comprime los vectores resultantes mediante PCA, reduciéndolos a unas pocas variables escalares antes de introducirlos en el modelo. Este enfoque genera un cuello de botella informativo: se descartan la mayoría de las dimensiones de la incrustación y la representación comprimida debe ser expandida nuevamente por el codificador de características de TabPFN, lo que introduce ineficiencias y pérdida de información. Inspirado en técnicas de alineación de modalidades como LLaVA o TableGPT, un nuevo adaptador de texto para TabPFN elimina la necesidad de PCA. Este adaptador, entrenable y ligero, mapea directamente las incrustaciones de texto en una secuencia corta de tokens dentro del espacio de incrustación de TabPFN, manteniendo congelados tanto el codificador de oraciones como el modelo base. De esta forma, se preserva la capacidad numérica de TabPFN mientras se integra de manera natural la información textual, logrando una eficiencia de entrenamiento superior a la de los pipelines completos de principio a fin. Esta innovación resulta especialmente relevante en escenarios empresariales donde se manejan datos mixtos, como descripciones de productos, comentarios de clientes o informes técnicos. En Q2BSTUDIO desarrollamos aplicaciones a medida que integran inteligencia artificial de vanguardia, permitiendo a las organizaciones explotar simultáneamente datos numéricos y textuales sin comprometer el rendimiento. Nuestro equipo también ofrece servicios cloud AWS y Azure para desplegar estos sistemas a escala, garantizando alta disponibilidad y seguridad. Además, combinamos estas capacidades con servicios de inteligencia de negocio basados en Power BI, creando paneles que reflejan insights extraídos de modelos avanzados. La ciberseguridad es un pilar en nuestras soluciones; protegemos cada capa del pipeline de datos, desde la ingesta hasta la inferencia. Con nuestro enfoque en ia para empresas, desarrollamos agentes IA que automatizan procesos analíticos y toman decisiones en tiempo real. El adaptador de texto para TabPFN sin PCA representa un avance significativo hacia una integración más fluida de datos textuales en modelos tabulares, y en Q2BSTUDIO estamos preparados para implementar estas mejoras en entornos productivos, ofreciendo software a medida que maximiza el valor de los datos de nuestras empresas clientes.