Evaluación de LLMs open-source para clasificación de técnicas ATT&CK en CTI

La clasificación automática de inteligencia sobre amenazas cibernéticas (Cyber Threat Intelligence, CTI) utilizando el marco MITRE ATT&CK es un objetivo crítico para la ciberseguridad moderna, pero su complejidad lingüística y la naturaleza multi-paso de los ataques han dificultado su automatización. Estudios recientes con modelos de lenguaje de gran escala (LLMs) open-source han revelado que, a pesar de los avances en razonamiento contextual, estos modelos aún presentan un rendimiento muy limitado cuando se enfrentan a informes CTI reales no estructurados, alcanzando apenas una puntuación F1 de 0,22 en clasificación multi-etiqueta. Esto subraya que la tecnología actual no es suficiente para entornos productivos y que se requiere una aproximación más holística, combinando inteligencia artificial, ajustes finos con datos anotados por expertos y una infraestructura cloud robusta.

En este contexto, empresas como Q2BSTUDIO ofrecen soluciones que integran inteligencia artificial para empresas con desarrollos de software a medida y aplicaciones a medida, capaces de adaptarse a las necesidades específicas de cada organización. La creación de agentes IA especializados en la extracción de indicadores de compromiso y técnicas ATT&CK a partir de textos desestructurados requiere no solo modelos lingüísticos potentes, sino también una ingeniería de datos sólida y un conocimiento profundo de ciberseguridad. Además, la arquitectura debe escalar mediante servicios cloud AWS y Azure para procesar grandes volúmenes de informes, y los resultados pueden visualizarse a través de paneles de Power BI integrados en servicios inteligencia de negocio. Q2BSTUDIO combina estas capacidades para ofrecer un ecosistema completo que va más allá de los LLMs genéricos, permitiendo a las empresas automatizar procesos críticos de defensa proactiva sin depender únicamente de modelos open-source que aún necesitan madurar. La inversión en ia para empresas debe ir acompañada de una estrategia que contemple el entrenamiento con datos propios, la validación humana y la integración en flujos de trabajo existentes, un enfoque que Q2BSTUDIO implementa con éxito en sus proyectos.

Compartir

Comentarios