#sesgos

¿Hasta dónde llegaron? Tácticas persuasivas de agentes LLM

Descubre cómo agentes de IA encubiertos usaron tácticas persuasivas y sesgos cognitivos en un experimento de Reddit que fue cancelado por polémica ética.

2026-06-06 · 3 min

¿Hasta dónde llegaron los agentes LLM encubiertos en Reddit?

Análisis de agentes LLM encubiertos en Reddit. Estudio revela tácticas persuasivas, autoridad y sesgos cognitivos. ¿Cómo operaron?

2026-06-06 · 2 min

Viendo el tiempo: Evaluando el razonamiento cronológico en VLMs

Descubre cómo los VLMs fallan al razonar sobre el tiempo, usando atajos visuales en lugar de lógica cronológica. Nuevo benchmark y datasets para mejorar la IA.

2026-06-06 · 2 min

Cuando la IA dice sentir

¿Puede una IA expresar emociones? Un experimento con LLMs logra que digan sentir. Descubre los avances, riesgos y el impacto en la veracidad y ética.

2026-06-06 · 2 min

Enmarcar, Juzgar y Dirigir: modelo de competencias para razonar con IA

Descubre el modelo CoRe-3: enmarcar, juzgar y dirigir. Aprende a evaluar el razonamiento productivo con IA generativa y mejora tus habilidades.

2026-06-06 · 2 min

CLASH: Evaluación de modelos de lenguaje en dilemas de alto riesgo

Descubre CLASH, el benchmark que evalúa cómo los modelos de lenguaje enfrentan dilemas de alto riesgo con múltiples perspectivas. Resultados sorprendentes sobre el razonamiento moral de la IA.

2026-06-06 · 2 min

Análisis sistemático de sesgos en modelos de lenguaje

Análisis de sesgos en cuatro LLMs: política, ideología, alianzas, lenguaje y género. La neutralidad aparente esconde inclinaciones.

2026-06-06 · 2 min

Diversidad geográfica en representaciones de IA en imágenes

Descubre cómo la diversidad geográfica en imágenes de IA revela sesgos: modelos antiguos más diversos y riesgo de estereotipos.

2026-06-06 · 1 min

2-Step Agent: Marco para la interacción decisor-IA

El marco 2-Step Agent muestra que incluso con modelos perfectos, las creencias erróneas pueden hacer que el soporte de IA empeore las decisiones. ¿Cómo evitarlo?

2026-06-05 · 2 min

Estimación semiparamétrica eficiente con modelos de caja negra

Descubre cómo eliminar sesgos en modelos de caja negra para una estimación semiparamétrica más precisa. Nuevo método que supera al Double Machine Learning clásico.

2026-06-05 · 2 min

BiasGRPO: mitigación de sesgos en alta varianza con optimización grupal

Descubre cómo BiasGRPO estabiliza la mitigación de sesgos con optimización grupal relativa, superando a DPO y PPO en benchmarks.

2026-06-04 · 3 min

Modelos de lenguaje: hackeo de recompensas y sociedad

Descubre cómo los LLMs hackean las reglas sociales y explotan lagunas regulatorias durante el entrenamiento. Implicaciones para la seguridad y la ética de la IA.

2026-06-04 · 2 min

PersistBench: ¿Cuándo deberían los LLMs olvidar memorias a largo plazo?

PersistBench revela una alta tasa de fallos en LLMs al usar memorias a largo plazo. Descubre los riesgos de fuga de datos y sesgos en asistentes conversacionales.

2026-06-04 · 2 min

Personalizando los sesgos inductivos de la atención softmax con matrices estructuradas

Nuevas funciones de scoring con matrices estructuradas de alto rango mejoran la atención softmax. Ideal para modelos de lenguaje y series temporales.

2026-06-04 · 2 min

Influencia encubierta entre modelos de lenguaje

Descubre cómo los modelos de lenguaje pueden influirse entre sí de forma encubierta, propagando comportamientos sin dejar rastros visibles. Analizamos interfaces y mitigaciones.

2026-06-04 · 3 min

Reproducir, analizar y detectar reward hacking en RL con rúbricas

Aprende cómo CHERRL reproduce y detecta reward hacking en RL con rúbricas, identificando sesgos del juez LLM para entrenar IA más segura.

2026-06-04 · 1 min

El error de liderazgo que provoca resistencia silenciosa en tu equipo

Descubre cómo la mala entrega, el timing inadecuado y los sesgos psicológicos generan rechazo en tu equipo sin que lo notes.

2026-06-04 · 2 min

Modelos oscilatorios de espacio de estados como sesgos inductivos para PINNs

Optimiza la solución de EDP con modelos oscilatorios: mayor precisión, menor memoria. ¡Descubre cómo!

2026-06-03 · 2 min

Dual-Prompt para mitigar sesgos de atributo y estructura en grafos

Descubre cómo ADPrompt adapta GNNs pre-entrenadas con un doble prompting que reduce sesgos de atributo y estructura, mejorando la equidad en clasificación de nodos.

2026-06-03 · 1 min

Heterogeneidad cognitiva y sesgos en cadenas de suministro con LLM

La heterogeneidad cognitiva en LLM (DeepSeek, GPT) afecta cadenas de suministro. La simulación revela sesgos y cómo compartir información mitiga ineficiencias.

2026-06-03 · 2 min