ProFact: Optimización multi-etapa de verificación de hechos con RL agéntico
Descubre cómo ProFact optimiza la verificación de hechos multi-etapa con aprendizaje por refuerzo agéntico y recompensas de proceso. ¡Lee más!
Descubre cómo ProFact optimiza la verificación de hechos multi-etapa con aprendizaje por refuerzo agéntico y recompensas de proceso. ¡Lee más!
Descubre cómo los calificadores GenAI evalúan exámenes K-12 con alta precisión en matemáticas y ciencias, aunque escepticismo en notas. Los modelos híbridos reducen la carga docente.
scLLM-DSC: un novedoso marco de clustering multimodal que aprovecha grandes modelos de lenguaje para mejorar la precisión en el análisis de células individuales.
Descubre cómo SWARR usa RL para hacer la atención de ventana deslizante competitiva en razonamiento matemático, recuperando precisión con eficiencia lineal.
Un marco multiagente ligero basado en IA logra un 98% de precisión en diseño de barreras de concreto, reduciendo costos y superando a modelos masivos.
Redes neuronales destiladas con física y LLM predicen propiedades en fabricación con alta precisión con datos escasos, para despliegue en tiempo real.
Descubre cómo redes neuronales destiladas con física y LLMs predicen propiedades de fabricación incluso con datos escasos. Ideal para monitoreo en tiempo real.
Descubre CVS: método sin entrenamiento para seleccionar datos de SFT visión-lenguaje, mejorando rendimiento un 4.8% con solo 15% de datos.
Descubre PaLRS, un método sin entrenamiento que alinea LLMs con preferencias humanas usando vectores de dirección residual. Mejora razonamiento y código sin costosos ajustes.
Descubre cómo la co-enseñanza bidireccional entre LLM y GNN supera las limitaciones del aprendizaje con pocos ejemplos en grafos, mejorando la precisión un 7.86%.
Descubre VQLC, alternativa escalable al clustering para descubrir conceptos en LLMs con alta coherencia.
Descubre cómo el ajuste de soft-prompt permite evaluar LLM de forma justa, eficiente y sin post-entrenamiento, revelando conocimiento real.
Descubre cómo se modelan, sintetizan y evalúan los entornos agentivos para LLMs y su co-evolución con la IA. Una revisión exhaustiva.
Descubre MLaGA, el asistente multimodal que integra texto e imágenes en grafos, optimizando el análisis con LLMs. ¡Mejora tu IA!
Aprende cómo un nuevo método de entrenamiento con programas probabilísticos mejora el razonamiento inductivo en LLMs, alineándolos con juicios humanos.
Los LLMs generan hipótesis científicas diversas y de alta calidad mediante un enfoque de muestreo que mejora la exploración sin sacrificar convergencia.
Descubre una interfaz de lenguaje natural para simulaciones multifísicas seguras en FEniCS, sin que la IA genere código crítico.
Descubre cómo TRACE asigna presupuesto de rollout a nodos prometedores en RL agente multi-turno, mejorando contraste de recompensas y rendimiento.
Descubre SpenseGPT: un método de poda one-shot que acelera la inferencia de LLMs hasta 1.2 veces en GPUs B200 con FP8, manteniendo la precisión del modelo.
Descubre N-GRPO, una nueva estrategia de exploración que mejora el razonamiento matemático de LLMs mediante la mezcla inteligente de embeddings semánticos. Resultados consistentes en benchmarks.