#modelos de lenguaje grande

ProFact: Optimización multi-etapa de verificación de hechos con RL agéntico

Descubre cómo ProFact optimiza la verificación de hechos multi-etapa con aprendizaje por refuerzo agéntico y recompensas de proceso. ¡Lee más!

2026-06-12 · 2 min

Evaluación de calificadores GenAI para K-12 con ingeniería de contexto

Descubre cómo los calificadores GenAI evalúan exámenes K-12 con alta precisión en matemáticas y ciencias, aunque escepticismo en notas. Los modelos híbridos reducen la carga docente.

2026-06-12 · 2 min

scLLM-DSC: Clustering multimodal con LLM para ARN-seq unicelular

scLLM-DSC: un novedoso marco de clustering multimodal que aprovecha grandes modelos de lenguaje para mejorar la precisión en el análisis de células individuales.

2026-06-12 · 2 min

Aprendizaje por refuerzo optimiza atención deslizante en razonamiento matemático

Descubre cómo SWARR usa RL para hacer la atención de ventana deslizante competitiva en razonamiento matemático, recuperando precisión con eficiencia lineal.

2026-06-11 · 2 min

Marco ligero multiagente para diseño automatizado de barreras de concreto

Un marco multiagente ligero basado en IA logra un 98% de precisión en diseño de barreras de concreto, reduciendo costos y superando a modelos masivos.

2026-06-11 · 2 min

Redes neuronales destiladas con física y LLM para fabricación

Redes neuronales destiladas con física y LLM predicen propiedades en fabricación con alta precisión con datos escasos, para despliegue en tiempo real.

2026-06-11 · 2 min

Redes neuronales destiladas con física y LLMs para fabricación

Descubre cómo redes neuronales destiladas con física y LLMs predicen propiedades de fabricación incluso con datos escasos. Ideal para monitoreo en tiempo real.

2026-06-11 · 2 min

¿Importa la pregunta? Selección datos sin entrenamiento para SFT visión-lenguaje

Descubre CVS: método sin entrenamiento para seleccionar datos de SFT visión-lenguaje, mejorando rendimiento un 4.8% con solo 15% de datos.

2026-06-11 · 2 min

Alineación de LLMs con Preferencias mediante Dirección Residual

Descubre PaLRS, un método sin entrenamiento que alinea LLMs con preferencias humanas usando vectores de dirección residual. Mejora razonamiento y código sin costosos ajustes.

2026-06-11 · 2 min

Más allá del Golden Teacher: co-enseñanza LLM-GNN

Descubre cómo la co-enseñanza bidireccional entre LLM y GNN supera las limitaciones del aprendizaje con pocos ejemplos en grafos, mejorando la precisión un 7.86%.

2026-06-11 · 1 min

Conceptos latentes cuantizados vectoriales: alternativa escalable al clustering

Descubre VQLC, alternativa escalable al clustering para descubrir conceptos en LLMs con alta coherencia.

2026-06-11 · 2 min

Ajuste de Soft-Prompt para benchmarks de LLM justos y eficientes

Descubre cómo el ajuste de soft-prompt permite evaluar LLM de forma justa, eficiente y sin post-entrenamiento, revelando conocimiento real.

2026-06-11 · 2 min

Ingeniería de entornos agentivos para LLMs: revisión y aplicaciones

Descubre cómo se modelan, sintetizan y evalúan los entornos agentivos para LLMs y su co-evolución con la IA. Una revisión exhaustiva.

2026-06-11 · 3 min

MLaGA: Asistente multimodal de lenguaje y grafos

Descubre MLaGA, el asistente multimodal que integra texto e imágenes en grafos, optimizando el análisis con LLMs. ¡Mejora tu IA!

2026-06-11 · 2 min

Usando programas probabilísticos para entrenar razonamiento inductivo en LLMs

Aprende cómo un nuevo método de entrenamiento con programas probabilísticos mejora el razonamiento inductivo en LLMs, alineándolos con juicios humanos.

2026-06-10 · 2 min

Hacia la búsqueda diversa de hipótesis científicas con LLMs

Los LLMs generan hipótesis científicas diversas y de alta calidad mediante un enfoque de muestreo que mejora la exploración sin sacrificar convergencia.

2026-06-10 · 3 min

Interfaz de lenguaje natural limitada para simulaciones multifísicas en FEniCS

Descubre una interfaz de lenguaje natural para simulaciones multifísicas seguras en FEniCS, sin que la IA genere código crítico.

2026-06-10 · 3 min

TRACE: Marco de asignación de rollout para RL agente eficiente

Descubre cómo TRACE asigna presupuesto de rollout a nodos prometedores en RL agente multi-turno, mejorando contraste de recompensas y rendimiento.

2026-06-10 · 2 min

SpenseGPT: poda de una sola pasada para inferencia de LLM

Descubre SpenseGPT: un método de poda one-shot que acelera la inferencia de LLMs hasta 1.2 veces en GPUs B200 con FP8, manteniendo la precisión del modelo.

2026-06-10 · 2 min

N-GRPO: Mezcla de Vecinos a Nivel de Embedding para Optimización de Políticas

Descubre N-GRPO, una nueva estrategia de exploración que mejora el razonamiento matemático de LLMs mediante la mezcla inteligente de embeddings semánticos. Resultados consistentes en benchmarks.

2026-06-10 · 2 min