#simulación

MCP-Persona: Benchmark para agentes LLM en apps personales

Nuevo benchmark MCP-Persona para evaluar agentes LLM en apps personales reales como Reddit y Slack. Simulación de entornos para mejorar su rendimiento.

2026-06-02 · 1 min

ClinEnv: Entorno EHR interactivo multi-etapa para agentes

ClinEnv evalúa LLMs como médicos en un EHR interactivo. Mide decisiones y proceso: el diagnóstico es más fiable que las acciones (0.51 vs 0.17 F1).

2026-06-02 · 2 min

Denoisers suavemente restringidos para modelos de difusión en EDP

Descubre cómo los denoisers suavemente restringidos mejoran el cumplimiento de EDPs sin rigidizar el modelo. Ideal para física computacional con IA.

2026-06-01 · 2 min

Reinterpretando los umbrales de seguridad como umbrales de disparo neuronal

Reinterpreta umbrales de seguridad como disparos neuronales con SNN para alinear evaluación de riesgos con el frenado humano.

2026-06-01 · 2 min

Modelado latente de compañeros en modelos mundiales para MARL

¿Cómo mejoran los modelos mundiales con teoría de la mente la coordinación multiagente en entornos parcialmente observables?

2026-06-01 · 2 min

Cuestionarios psicométricos humanos malinterpretan comportamiento de LLMs

Estudio revela: los cuestionarios psicométricos no reflejan el comportamiento real de los LLM. La generación de probabilidades es más precisa.

2026-06-01 · 2 min

Aprendizaje de dinámicas macroscópicas invariantes a permutaciones

Descubre cómo modelar sistemas de partículas sin orden fijo con autoencoders invariantes a permutaciones. Aprende dinámicas macroscópicas para fluidos y polímeros.

2026-06-01 · 2 min

Inferencia Bayesiana Escalable para Leyes de Conservación No Lineales

Aprende cómo la inferencia bayesiana escalable con procesos gaussianos resuelve problemas inversos en segundos, superando a métodos de deep learning.

2026-06-01 · 2 min

Transformadores Universales Fijos: El poder de la representación

¿Sabías que un transformer fijo puede simular cualquier otro modelo? Investigación revela que el poder está en la representación, no en los pesos. Entra y descúbrelo.

2026-06-01 · 2 min

Light Interaction: Aceleración sin entrenamiento para modelos de video interactivos

Light Interaction acelera hasta 2.59x la inferencia de modelos de video interactivos sin reentrenamiento, manteniendo calidad visual. Ideal para simulación y navegación virtual.

2026-06-01 · 2 min

Certificados automáticos de convergencia en MCMC de transporte

CerT-MCMC ofrece certificados automáticos de convergencia para MCMC con flujos normalizantes, con cotas no vacías incluso en altas dimensiones. ¡Más fiabilidad!

2026-06-01 · 3 min

KnowledgeGain: Evaluando noticias científicas para el aprendizaje

Descubre cómo KnowledgeGain evalúa y optimiza la generación de noticias científicas para maximizar el aprendizaje del lector usando IA.

2026-06-01 · 2 min

SWIM: Imitación de cuerpo completo para natación

SWIM: nuevo método de imitación para animación de natación. Aprende de un solo movimiento, se adapta a entornos y estilos. Eficiente, robusto y generalizable.

2026-06-01 · 3 min

Evitación de colisiones en multitudes: simulación basada en datos

El modelo CPGAN integra la física de colisiones en la función de pérdida para simular evitación de colisiones en multitudes, reduciendo drásticamente los choques en flujos bidireccionales.

2026-06-01 · 1 min

¿Cuáles son las alternativas a las pruebas de penetración y la seguridad de aplicaciones?

Explora alternativas a las pruebas de penetración en seguridad de aplicaciones: métodos como SAST, DAST, IAST y RASP para proteger tus sistemas.

2026-05-30 · 1 min

VFEAgent: Un Marco de Agente Multimodal para Análisis de Elementos Finitos Automatizado de Extremo a Extremo

VFEAgent es un marco multimodal que automatiza el análisis de elementos finitos, acelerando simulaciones ingenieriles con inteligencia artificial.

2026-05-30 · 2 min

BEAMS: Evaluación y Benchmarking de IA para Modelado y Simulación

2026-05-30 · 2 min

Superando la brecha sim-real en el despacho industrial basado en aprendizaje por refuerzo mediante semántica de ejecución.

Supera la brecha sim-real en despacho industrial con Reinforcement Learning y semántica de ejecución. Optimiza eficiencia y precisión en entornos industriales.

2026-05-30 · 2 min

EvoMD-LLM: Aprendiendo el lenguaje de la evolución de especies en dinámica molecular reactiva

EvoMD-LLM descifra la evolución en dinámica molecular reactiva mediante inteligencia artificial. Descubre cómo esta herramienta revoluciona el estudio de reacciones químicas.

2026-05-30 · 2 min

Battery-Sim-Agent: Uso de agente LLM para estimación inversa de parámetros de batería

2026-05-30 · 2 min