Samudra 2: Emulador oceánico neural multi-resolución
Samudra 2 emula océanos con alta resolución en GPU, reduciendo errores en campos profundos. Permite proyecciones climáticas de décadas y estudio de remolinos.
Samudra 2 emula océanos con alta resolución en GPU, reduciendo errores en campos profundos. Permite proyecciones climáticas de décadas y estudio de remolinos.
Diagnóstico y mitigación del colapso de flujo en hiperconexiones de modelos Transformer. Aprende a romper la simetría y mejorar el rendimiento.
Descubre cómo el período de aislamiento del profesor evita colapsos en destilación autónoma. Presentamos CGTR, que logra cero colapsos en múltiples tareas.
Descubre cómo COPSD logra un mejor equilibrio entre seguridad y utilidad en modelos de IA, reduciendo el costo de la seguridad en razonamiento general.
Descubre cómo clasificar y predecir fallos en RLHF como reward hacking y colapso. Estudio empírico con PPO y DPO que revela dinámicas ocultas.
Descubre STPGC, nuevos algoritmos escalables para reducir grafos preservando su topología, acelerando el entrenamiento de GNNs sin perder rendimiento.
Nueva teoría de bifurcación revela que reemplazar ReLU por activaciones no monótonas evita el sobresuavizado en GNNs profundas. ¡Descubre la solución!
Analizamos la propagación de errores en modelos de difusión con datos sintéticos. Primeras cotas inferiores de divergencia y regímenes de deriva.
El colapso de caminos marginales afecta la composición de expertos en difusión. Conoce el criterio de existencia y la corrección ACE para estabilizar la generación.
Descubre cómo RGVQ evita el colapso del codebook en grafos usando regularización topológica y contrastiva para tokens más expresivos.
Nuevo benchmark Loopzero revela cómo evaluar advertencias de colapso recursivo con control de falsos positivos. ¿Funciona? Resultados sorprendentes.
Descubre cómo la relación señal-ruido no uniforme en el estimador REINFORCE causa inestabilidad y colapso durante el entrenamiento en RL.
MASCOT mejora consistencia y diálogo en agentes multi-sistema, evitando redundancias. Descubre su optimización bi-nivel para compañeros socio-colaborativos.
Analizamos cómo la codificación de etiquetas (one-hot) afecta el colapso neuronal en redes, con foco en el sesgo del clasificador y la pérdida MSE.
Investigación con Qwen3.5-4B: una intervención relacional en primera persona logra recuperar el comportamiento de un modelo colapsado, mientras que solo estructura o solo registro no bastan.
La diversidad en exploración supera a la frecuencia de uso de herramientas. Descubre el colapso y cómo la regularización de entropía mejora el razonamiento.
UR-JEPA logra un 0.83% más de precisión que LeJEPA en Inet10 con menor varianza, y produce representaciones geométricamente distintas.
Descubre cómo los LLMs reducen la diversidad de argumentos en debates públicos. Un estudio revela el 'colapso argumental' y sus implicaciones para el discurso social.
Descubre cómo la métrica Decan mide la diversidad en textos creativos usando aprendizaje en contexto, detectando pérdida de diversidad en modelos de lenguaje.
Descubre por qué la edición de parámetros en LLMs daña capacidades clave. Evidencia empírica muestra que la recuperación supera a la edición paramétrica.