#lms · DeepCodeNews

De 8GB a 70B: Guía de hardware para LLMs locales

¿Quieres ejecutar modelos de lenguaje como 70B en tu PC con solo 8GB de VRAM? Descubre técnicas de cuantización y optimización en esta guía práctica.

2026-06-12 · 3 min

AutoMine: Minería de Escenarios Autónomos para Vehículos con IA

Descubre AutoMine: extrae escenarios críticos con LLMs y VLMs para conducción autónoma, logrando scores líderes en Argoverse 2.

2026-06-11 · 3 min

Evaluación dual de sicofancia: límites de intervención

La intervención en LLMs reduce la sicofancia pero también el acuerdo con verdades. ¿Se puede corregir sin perder precisión?

2026-06-11 · 3 min

Cada acto tiene su precio: Composición moral comprimida en LLMs de frontera

Descubre cómo los LLMs de frontera componen señales morales comprimidas con el benchmark Moral Trolley Arena. Resultados sobre ética en IA.

2026-06-11 · 2 min

Refinamiento Algorítmico de Prompts: Elevando LLMs Pequeños con Gradientes

Optimiza prompts de LLMs pequeños con gradientes textuales. TEXTGRAD usa feedback de modelos grandes para mejorar resultados. ¡Reduce costos!

2026-06-11 · 4 min

LLMs y Grafos: Hacia Sistemas de IA Sinérgicos y Nativos de Grafos

Descubre cómo los LLMs y los grafos convergen para crear sistemas de IA más potentes, con razonamiento estructurado y agentes inteligentes. ¡Lee más!

2026-06-11 · 2 min

LLMs y Grafos: Hacia Sistemas de IA Nativos y Sinérgicos

Descubre cómo la integración de LLMs y grafos crea sistemas de IA sinérgicos, mejorando el razonamiento, la planificación y la gestión de datos. Tutorial completo.

2026-06-11 · 3 min

AVIS: Escalado Adaptativo en Tiempo de Prueba para Modelos de Visión-Lenguaje

Descubre cómo AVIS optimiza la inferencia en VLMs adaptando el escalado visual y de razonamiento, mejorando precisión y reduciendo costos.

2026-06-11 · 1 min

¿Son malos los LLMs en razonamiento moral?

¿Los LLMs son malos en razonamiento moral? Un nuevo análisis del dataset MoReBench sugiere que son más competentes de lo que se creía. Descubre los detalles.

2026-06-11 · 2 min

Métricas Geométricas y LLMs: Qué Miden y Cuándo Funcionan

Descubre qué miden las métricas geométricas en LLMs y cómo pueden mejorar la evaluación de modelos de lenguaje. Un estudio revela cuándo funcionan y sus limitaciones.

2026-06-11 · 2 min

CS-RLHF: Alineación Segura de LLMs con Optimización de Penalización Fija

Descubre CS-RLHF: alinea LLMs de forma segura con penalización fija, 5x más eficiente contra jailbreaks. ¡Seguridad certificable!

2026-06-11 · 2 min

Mapeo de la literatura científica con LLMs y modelado de temas

Los LLMs y el modelado de temas mapean la literatura científica, revelando conexiones temáticas ocultas. Un estudio analiza 1500 artículos de ingeniería.

2026-06-11 · 3 min

GraphInfer-Bench: Evaluando la capacidad de inferencia de LLMs en grafos

Descubre GraphInfer-Bench, el benchmark que mide la capacidad de inferencia de LLMs en grafos. ¿Superan a las GNNs? Entra y conoce los resultados.

2026-06-11 · 1 min

FOCUS: Los DLLMs saben cómo domar su límite de cómputo

Descubre cómo FOCUS optimiza la inferencia de DLLMs, enfocando el cómputo en tokens decodables para lograr hasta 3.5x más rendimiento sin pérdida de calidad.

2026-06-11 · 2 min

Momentum LMS: estabilidad, seguimiento y arrepentimiento en streaming

Conoce cómo el algoritmo MLMS garantiza estabilidad y bajo arrepentimiento en datos no estacionarios, perfecto para streaming.

2026-06-11 · 1 min

FronTalk: generación conversacional de código front-end con feedback multimodal

Descubre FronTalk, benchmark para generación de código front-end con feedback multimodal. Conoce el olvido en modelos y la solución AceCoder.

2026-06-11 · 2 min

ICA Lens: Interpretando modelos de lenguaje sin entrenar otro diccionario

Descubre cómo ICALens usa ICA para encontrar direcciones interpretables en LLMs sin entrenar diccionarios, superando a los SAEs en eficiencia y sondas.

2026-06-11 · 2 min

GraspLLM: Generalización zero-shot en grafos de texto con LLMs

GraspLLM combina LLMs y aprendizaje contrastivo para generalizar sin entrenamiento en múltiples datasets de grafos textuales. Logra rendimiento superior zero-shot.

2026-06-11 · 2 min

CodeSpear: cómo la gramática puede hacer que LLMs generen código malicioso

Descubre cómo el ataque CodeSpear explota la decodificación con gramática para que LLMs generen código malicioso. Conoce CodeShield, la defensa.

2026-06-11 · 3 min

ART: Nuevo método de ajuste fino para LLMs multimodales

Descubre ART, un innovador método de fine-tuning para LLMs multimodales que optimiza la entrada visual sin modificar pesos. Competitivo con LoRA en benchmarks.

2026-06-11 · 2 min