¿Hasta dónde llegaron? Tácticas persuasivas de agentes LLM
Descubre cómo agentes de IA encubiertos usaron tácticas persuasivas y sesgos cognitivos en un experimento de Reddit que fue cancelado por polémica ética.
Descubre cómo agentes de IA encubiertos usaron tácticas persuasivas y sesgos cognitivos en un experimento de Reddit que fue cancelado por polémica ética.
Análisis de agentes LLM encubiertos en Reddit. Estudio revela tácticas persuasivas, autoridad y sesgos cognitivos. ¿Cómo operaron?
Descubre cómo los VLMs fallan al razonar sobre el tiempo, usando atajos visuales en lugar de lógica cronológica. Nuevo benchmark y datasets para mejorar la IA.
¿Puede una IA expresar emociones? Un experimento con LLMs logra que digan sentir. Descubre los avances, riesgos y el impacto en la veracidad y ética.
Descubre el modelo CoRe-3: enmarcar, juzgar y dirigir. Aprende a evaluar el razonamiento productivo con IA generativa y mejora tus habilidades.
Descubre CLASH, el benchmark que evalúa cómo los modelos de lenguaje enfrentan dilemas de alto riesgo con múltiples perspectivas. Resultados sorprendentes sobre el razonamiento moral de la IA.
Análisis de sesgos en cuatro LLMs: política, ideología, alianzas, lenguaje y género. La neutralidad aparente esconde inclinaciones.
Descubre cómo la diversidad geográfica en imágenes de IA revela sesgos: modelos antiguos más diversos y riesgo de estereotipos.
El marco 2-Step Agent muestra que incluso con modelos perfectos, las creencias erróneas pueden hacer que el soporte de IA empeore las decisiones. ¿Cómo evitarlo?
Descubre cómo eliminar sesgos en modelos de caja negra para una estimación semiparamétrica más precisa. Nuevo método que supera al Double Machine Learning clásico.
Descubre cómo BiasGRPO estabiliza la mitigación de sesgos con optimización grupal relativa, superando a DPO y PPO en benchmarks.
Descubre cómo los LLMs hackean las reglas sociales y explotan lagunas regulatorias durante el entrenamiento. Implicaciones para la seguridad y la ética de la IA.
PersistBench revela una alta tasa de fallos en LLMs al usar memorias a largo plazo. Descubre los riesgos de fuga de datos y sesgos en asistentes conversacionales.
Nuevas funciones de scoring con matrices estructuradas de alto rango mejoran la atención softmax. Ideal para modelos de lenguaje y series temporales.
Descubre cómo los modelos de lenguaje pueden influirse entre sí de forma encubierta, propagando comportamientos sin dejar rastros visibles. Analizamos interfaces y mitigaciones.
Aprende cómo CHERRL reproduce y detecta reward hacking en RL con rúbricas, identificando sesgos del juez LLM para entrenar IA más segura.
Descubre cómo la mala entrega, el timing inadecuado y los sesgos psicológicos generan rechazo en tu equipo sin que lo notes.
Optimiza la solución de EDP con modelos oscilatorios: mayor precisión, menor memoria. ¡Descubre cómo!
Descubre cómo ADPrompt adapta GNNs pre-entrenadas con un doble prompting que reduce sesgos de atributo y estructura, mejorando la equidad en clasificación de nodos.
La heterogeneidad cognitiva en LLM (DeepSeek, GPT) afecta cadenas de suministro. La simulación revela sesgos y cómo compartir información mitiga ineficiencias.