TimeROME-DLM: Edición de conocimiento en inferencia sin entrenamiento
TimeROME-DLM permite editar conocimiento en modelos de difusión enmascarados sin reentrenar. Rápido, sin VRAM extra, escala a 400 hechos. ¡Conócelo!
TimeROME-DLM permite editar conocimiento en modelos de difusión enmascarados sin reentrenar. Rápido, sin VRAM extra, escala a 400 hechos. ¡Conócelo!
UOJ-Bench evalúa LLMs en programación competitiva: generación, hacking y reparación. En una prueba, fallan en detectar >50% errores; con escalado superan >90%.
GRASP combina visión-lenguaje y planificación neuro-simbólica para agarre robótico con lenguaje natural. 73.3% de éxito sin entrenamiento. ¡Descúbrelo!
Descubre por qué el orden no implica control en sistemas complejos: evidencia experimental en IA, biología y modelos de lenguaje que redefine la alineación.
Descubre cómo proteger tus modelos de difusión de imágenes con una nueva técnica de fingerprinting robusta contra ataques de colusión. Precisión superior al 99.5% y alta fidelidad.
scLLM-DSC: un novedoso marco de clustering multimodal que aprovecha grandes modelos de lenguaje para mejorar la precisión en el análisis de células individuales.
Descubre cómo EA-WM integra verificación de eventos en modelos del mundo para una manipulación robótica más precisa y segura en tareas de largo horizonte.
EA-WM verifica eventos en modelos de mundo para manipulación robótica a largo plazo. Mejora planificación y control con predicciones interpretables.
Descubre cómo TWLA, mediante cuantización post-entrenamiento, reduce el tamaño y acelera la inferencia de LLMs usando pesos ternarios y activaciones de 4 bits.
TWLA permite cuantizar LLMs a pesos ternarios y activaciones de 4 bits, reduciendo el costo de inferencia sin perder precisión.
Descubre cómo la regulación emocional artificial mejora la clasificación de imágenes con deep learning, superando métodos previos en datasets CIFAR.
Los sistemas de IA con LLM logran penetrar servidores de forma autónoma hasta en un 69% de los casos. Conoce el estudio y sus implicaciones.
G-Long revoluciona la gestión de memoria en agentes de diálogo con grafos, logrando consistencia a largo plazo y reduciendo costos computacionales.
Descubre cómo IVT enseña a modelos visión-lenguaje a corregir sus errores espaciales: precisión 82% y degradación 5x menor.
NTS-CoT reduce alucinaciones en resúmenes temporales de noticias con razonamiento en cadena. Descubre cómo mejora la fidelidad y precisión.
Descubre cómo la automatización de flujos de trabajo con IA transforma tu negocio en Murcia. Q2BSTUDIO te ofrece soluciones personalizadas.
Nuevo benchmark CreativeBench: mide la creatividad de la IA en generación de código usando desafíos autoevolutivos. Descubre sus resultados.
Descubre cómo el desacuerdo entre modelos de IA permite detectar errores sin etiquetas. Un método simple y sin entrenamiento que supera a las técnicas tradicionales.
Descubre los límites informacionales de las explicaciones por enmascaramiento en IA. Implicaciones para LIME y KernelSHAP.
¿El benchmark ROAR es confiable? Descubre cómo la borrosidad en mapas de atribución infla resultados y engaña.