Datos instrumentados para machine learning científico causal
Datos instrumentados: modelos, incertidumbre y contrafactuales para ML científico causal. Aplicaciones en validación y auditoría.
Datos instrumentados: modelos, incertidumbre y contrafactuales para ML científico causal. Aplicaciones en validación y auditoría.
¿Qué tan robustos son los VLMs ante problemas STEM en varios idiomas? Sci-Rho te lo muestra con un benchmark simbólico multilingüe y visual.
Explora el estudio SciText2Eq: cómo los LLMs generan ecuaciones explicables desde textos científicos, los desafíos en semántica y la alineación con juicios
LabOSBench: un benchmark realista y de bajo costo para evaluar agentes multimodales en el control de instrumentos científicos. Ideal para IA y automatización
Nuevo estudio analiza más de 100 modelos: el post-entrenamiento no mejora uniformemente. Descubre la composición ideal para rendimiento dentro y fuera de
Descubre cómo los Gemelos Latentes Conformes a la Física garantizan que los modelos sustitutos respeten leyes de conservación, mejorando la precisión en
Descubre cómo la IA LLM puntúa manuscritos como revisores humanos. Validado en 300 artículos ICLR con AUROC 0.82.
Estudio con 6,900 personas: IA supera a humanos expertos en persuasión, incluso tras entrenamiento. Logró recaudar 3x más fondos.
Conoce Agent Rosetta, un agente de IA basado en LLM que diseña proteínas usando Rosetta. Logra resultados expertos incluso con aminoácidos no canónicos.
Agent Rosetta combina razonamiento LLM con software Rosetta para diseñar proteínas, incluyendo aminoácidos no canónicos, superando a modelos tradicionales.
La reutilización de modelos preentrenados de deep learning impacta más en pruebas; adaptación es el patrón dominante. Bioquímica y genética lideran.
Descubre cómo un Co-científico IA con agentes LLM mejoró un +0.083% el ranking de búsqueda en una plataforma de viajes, cerrando el ciclo
MatSciBench evalúa LLM en ciencia de materiales: DeepSeek-R1 logra 75% en texto, GPT-5 53% en imágenes. Descubre sus limitaciones.
Descubre cómo las redes neuronales mejoran la calidad de compresión de datos científicos, pero no aumentan la relación de compresión.
A diferencia del cine, la confirmación alienígena real será gradual y científica, como el bosón de Higgs. Descubre cómo.
Descubre cómo SciAgentArena evalúa agentes de IA en tareas científicas reales. ¿Son capaces de generar ideas novedosas? Resultados y fallos comunes.
SciR: benchmark controlable para razonamiento científico en LLMs. Evalúa deducción, inducción y causalidad. Dificultad ajustable.
Descubre el marco de tres capas para IA en ciencia: búsqueda, razonamiento cualitativo y ejecución. La formación de modelos es el núcleo.
Descubre cómo EurekAgent revoluciona el descubrimiento científico autónomo mediante ingeniería del entorno, logrando récords con menos de $11 en costos de API. ¡Lee más!
Descubre cómo Agents-K1 convierte papers científicos en grafos de conocimiento para mejorar el razonamiento de agentes de IA. Pipeline innovador con Scholar-KG.