MortarBench: Evaluación de Agentes de Originación de Hipotecas
Nuevo benchmark MortarBench revela que LLMs solo aciertan 77% en préstamos hipotecarios y tienen sesgos. CRIT mejora al 80.5%.
Nuevo benchmark MortarBench revela que LLMs solo aciertan 77% en préstamos hipotecarios y tienen sesgos. CRIT mejora al 80.5%.
Descubre cómo la memoria del usuario sesga el razonamiento emocional en LLMs y perpetúa desigualdades. Nuevo estudio revela sesgos ocultos.
Estudio revela cómo sistemas de IA en democracias y autocracias habilitan el autoritarismo mediante centralización y supervisión débil.
RecourseBench: marco modular y reproducible para evaluar recursos algorítmicos. Integra 28 métodos con tests automáticos. ¡Prueba su interfaz web!
Descubre cómo la miopía metacognitiva afecta a los LLMs, generando sesgos y errores en decisiones críticas. Implicaciones éticas y técnicas.
Explora cómo la IA puede fortalecer la democracia, abordando baja participación, desinformación y sesgos. Oportunidades y riesgos para el futuro.
¿Los LLMs son malos en razonamiento moral? Un nuevo análisis del dataset MoReBench sugiere que son más competentes de lo que se creía. Descubre los detalles.
Descubre cómo la influencia de las grandes tecnológicas impulsa una IA irresponsable, generando graves impactos sociales y ambientales. Un llamado a la acción para investigadores.