ExCyTIn-Bench: Evaluación de agentes LLM en la Investigación de Amenazas Cibernéticas
<meta name=description content=ExCyTIn-Bench evalúa el rendimiento de agentes LLM frente a amenazas cibernéticas. Descubre cómo este benchmark mide su efectividad en ciberseguridad.>