Aprendizaje por refuerzo robusto con currículo para UAV en entornos hostiles
Novedoso aprendizaje por refuerzo robusto con currículo adaptativo protege UAV contra suplantación GNSS, logrando 100% éxito.
Novedoso aprendizaje por refuerzo robusto con currículo adaptativo protege UAV contra suplantación GNSS, logrando 100% éxito.
Descubre cómo LoRA-MCL genera múltiples continuaciones de texto diversas y relevantes usando adaptadores de bajo rango. Ideal para subtitulado y traducción.
Descubre cómo mi hogar inteligente con Home Assistant aprende mis rutinas diarias sin necesidad de IA en la nube. Privacidad y automatización local.
Descubre cómo los modelos de difusión no idénticos mejoran la generación de canales MIMO-OFDM, manejando la confiabilidad variable de cada subportadora.
Descubre TalkPlayData 2, un dataset sintético de agentes LLM para recomendación musical conversacional. ¡Impulsa tus modelos con datos realistas!
Descubre cómo Wavelet Fourier Diffuser mejora el aprendizaje por refuerzo offline al corregir desplazamientos de frecuencia. Resultados superiores en D4RL.
ACC-MARL: Aprendizaje por refuerzo multiagente cooperativo condicionado por autómatas. Entrena políticas descentralizadas y coordina tareas temporales. ¡Lee más!
PHASE: nuevo método de IA para reconstrucción hiperespectral fisiológica desde RGB. Logra +2.20 SSIM y -3.06 SAM con solo 1.5% de datos. Ideal para diagnóstico no invasivo.
Descubre cómo un sistema de aprendizaje por refuerzo ha logrado mejorar los límites del número de beso, resolviendo un problema abierto desde Newton.
Aprende cómo la física y los operadores diferenciales condicionan la optimización en SciML. Métodos de primer y segundo orden, aplicaciones prácticas y desafíos.
Descubre cómo Aletheia revela la receta óptima para entrenar verificadores de código según la escala del modelo. Ahorra costos sin sacrificar precisión.
Descubre PVF, un nuevo método de decodificación paralela para modelos de difusión que reduce hasta un 65% las evaluaciones de función sin perder precisión.
Descubre cómo la elicitación causal de preferencias acelera el descubrimiento causal con consultas activas a expertos. Un enfoque bayesiano para concentrar la posterior sobre DAGs.
Descubre cómo Phantom Transfer envenena datos y evade todas las defensas conocidas. Aprende por qué fallan las defensas actuales.
Aprende cómo la técnica de modelos mundiales acoplados permite entrenar RL de forma eficiente sin simuladores, usando difusión y gradientes de primer orden para tareas de manipulación.
Optimiza el razonamiento infinito-horizonte con InftyThink+ usando RL. Mejora precisión y eficiencia, superando limitaciones del chain-of-thought.
Descubre PAND: destilación de vecindad consciente de prompts para clasificación visual fina. Supera al estado del arte con modelos ligeros.
Descubre cómo los modelos de difusión en espacio espectral integran leyes físicas para resolver PDEs con eficiencia y precisión. Ideal para ingeniería y ciencia.
Habilidades modulares para LLMs: arquitectura, adquisición y seguridad. 26% de habilidades tienen vulnerabilidades. Marco de confianza propuesto. ¡Futuro de agentes!
Descubre cómo un enfoque adaptativo con LLM y redes neuronales predice opiniones grupales con solo el 10% de encuestados.