#llms

Evaluación dual de sicofancia: límites de intervención

La intervención en LLMs reduce la sicofancia pero también el acuerdo con verdades. ¿Se puede corregir sin perder precisión?

2026-06-11 · 3 min

Cada acto tiene su precio: Composición moral comprimida en LLMs de frontera

Descubre cómo los LLMs de frontera componen señales morales comprimidas con el benchmark Moral Trolley Arena. Resultados sobre ética en IA.

2026-06-11 · 2 min

Refinamiento Algorítmico de Prompts: Elevando LLMs Pequeños con Gradientes

Optimiza prompts de LLMs pequeños con gradientes textuales. TEXTGRAD usa feedback de modelos grandes para mejorar resultados. ¡Reduce costos!

2026-06-11 · 4 min

LLMs y Grafos: Hacia Sistemas de IA Sinérgicos y Nativos de Grafos

Descubre cómo los LLMs y los grafos convergen para crear sistemas de IA más potentes, con razonamiento estructurado y agentes inteligentes. ¡Lee más!

2026-06-11 · 2 min

LLMs y Grafos: Hacia Sistemas de IA Nativos y Sinérgicos

Descubre cómo la integración de LLMs y grafos crea sistemas de IA sinérgicos, mejorando el razonamiento, la planificación y la gestión de datos. Tutorial completo.

2026-06-11 · 3 min

¿Son malos los LLMs en razonamiento moral?

¿Los LLMs son malos en razonamiento moral? Un nuevo análisis del dataset MoReBench sugiere que son más competentes de lo que se creía. Descubre los detalles.

2026-06-11 · 2 min

Métricas Geométricas y LLMs: Qué Miden y Cuándo Funcionan

Descubre qué miden las métricas geométricas en LLMs y cómo pueden mejorar la evaluación de modelos de lenguaje. Un estudio revela cuándo funcionan y sus limitaciones.

2026-06-11 · 2 min

CS-RLHF: Alineación Segura de LLMs con Optimización de Penalización Fija

Descubre CS-RLHF: alinea LLMs de forma segura con penalización fija, 5x más eficiente contra jailbreaks. ¡Seguridad certificable!

2026-06-11 · 2 min

Mapeo de la literatura científica con LLMs y modelado de temas

Los LLMs y el modelado de temas mapean la literatura científica, revelando conexiones temáticas ocultas. Un estudio analiza 1500 artículos de ingeniería.

2026-06-11 · 3 min

GraphInfer-Bench: Evaluando la capacidad de inferencia de LLMs en grafos

Descubre GraphInfer-Bench, el benchmark que mide la capacidad de inferencia de LLMs en grafos. ¿Superan a las GNNs? Entra y conoce los resultados.

2026-06-11 · 1 min

FOCUS: Los DLLMs saben cómo domar su límite de cómputo

Descubre cómo FOCUS optimiza la inferencia de DLLMs, enfocando el cómputo en tokens decodables para lograr hasta 3.5x más rendimiento sin pérdida de calidad.

2026-06-11 · 2 min

ICA Lens: Interpretando modelos de lenguaje sin entrenar otro diccionario

Descubre cómo ICALens usa ICA para encontrar direcciones interpretables en LLMs sin entrenar diccionarios, superando a los SAEs en eficiencia y sondas.

2026-06-11 · 2 min

GraspLLM: Generalización zero-shot en grafos de texto con LLMs

GraspLLM combina LLMs y aprendizaje contrastivo para generalizar sin entrenamiento en múltiples datasets de grafos textuales. Logra rendimiento superior zero-shot.

2026-06-11 · 2 min

CodeSpear: cómo la gramática puede hacer que LLMs generen código malicioso

Descubre cómo el ataque CodeSpear explota la decodificación con gramática para que LLMs generen código malicioso. Conoce CodeShield, la defensa.

2026-06-11 · 3 min

ART: Nuevo método de ajuste fino para LLMs multimodales

Descubre ART, un innovador método de fine-tuning para LLMs multimodales que optimiza la entrada visual sin modificar pesos. Competitivo con LoRA en benchmarks.

2026-06-11 · 2 min

Más que alineamiento: modelos guiados por cerebro para razonamiento robusto

Razonamiento mejorado: señales cerebrales guían a modelos de lenguaje, logrando un 13% más de precisión.

2026-06-11 · 2 min

VIA-SD: Verificación jerárquica con enrutamiento intra-modelo

Descubre VIA-SD, un nuevo método de decodificación especulativa que acelera la inferencia de LLMs hasta 3x reduciendo rechazos mediante verificación jerárquica.

2026-06-11 · 2 min

Sistemas de razonamiento y agentes en series temporales con LLMs

Evaluamos topologías de razonamiento, benchmarks y guías para sistemas fiables en series temporales con LLMs. Descubre cómo transforman el análisis y la toma de decisiones.

2026-06-11 · 1 min