#ate · DeepCodeNews

Más allá de la memoria en tiempo de test: control óptimo para LLM

Descubre cómo la nueva capa TTC integra control óptimo en LLMs, mejorando el razonamiento matemático hasta un 27.8% en benchmarks como MATH-500. Una innovación

2026-06-03 · 2 min

Modelos de Lenguaje Esotéricos: LLMs de Difusión de Cualquier Orden

Eso-LMs: modelos de lenguaje que combinan AR y MDM con atención causal y caché KV, permitiendo generación paralela e inferencia eficiente. Nuevo estado del arte.

2026-06-03 · 2 min

HUNT: Navegación y seguimiento de drones a alta velocidad en entornos complejos

Descubre HUNT, el sistema que permite a drones navegar a alta velocidad y seguir objetivos en entornos sin GPS ni estructuras. Ideal para búsqueda y rescate.

2026-06-03 · 2 min

Surrogados profundos con física para la ecuación de Boltzmann de fonones

Nuevo sustituto profundo con física reduce hasta un 70% los datos de entrenamiento para simular transporte térmico a nanoescala, con errores del 5%. Ideal para diseño de materiales.

2026-06-03 · 2 min

Guía del autoestopista: estimación de gradientes Poisson

Descubre cómo estimar gradientes Poisson sin sesgo con el método EAT modificado. Comparativa con Gumbel-Softmax para VAEs y modelos de inferencia neuronal.

2026-06-03 · 2 min

¿Hasta dónde pueden crecer los modelos generativos de materiales?

Descubre RADII, el primer benchmark que mide la frontera de extrapolación en modelos generativos de materiales. ¿Hasta dónde pueden escalar?

2026-06-03 · 3 min

Inferencia basada en momentos para regresión con covariables Latent Dirichlet

Aprende cómo los momentos corregidos evitan la incertidumbre al inferir coeficientes de regresión con modelos de tópicos.

2026-06-03 · 2 min

Descubrimiento de señales con ML sin modelo: uniendo teoría y práctica

Descubre cómo las técnicas de Machine Learning permiten buscar señales sin depender de modelos teóricos, aumentando el potencial de descubrimiento.

2026-06-03 · 3 min

Por qué ejecutamos 4+ agentes SDR de IA ahora

Ejecutamos 4+ agentes SDR de IA especializados. ¿Por qué? Porque la especialización genera más pipeline que las plataformas todo-en-uno. Conoce nuestra estrategia.

2026-06-03 · 3 min

Entrata: primer IPO de software PE con 23% de crecimiento, sin aceleración

Entrata, con $575M ARR y 23% de crecimiento, abre la ola de IPOs de software PE. El problema: casi ninguno acelera. Análisis y valoración.

2026-06-03 · 3 min

Vectores funcionales multimodales para relaciones visuales

Descubre cómo los vectores de función multimodal permiten extraer y optimizar relaciones visuales en modelos de IA, mejorando el razonamiento sin necesidad de reentrenar.

2026-06-03 · 1 min

ReasonBENCH: La inestabilidad del razonamiento en LLMs

ReasonBENCH revela: la inestabilidad en el razonamiento de LLMs no es ruido, es estructura. Un solo test puede engañar. ¡Evalúa con distribuciones!

2026-06-03 · 2 min

Prototype Transformer: hacia modelos interpretables por diseño

ProtoT usa prototipos para modelos de lenguaje interpretables, permitiendo transparencia y ediciones dirigidas.

2026-06-03 · 2 min

c-TPE: Estimador Parzen con restricciones para hiperparámetros

Aprende cómo c-TPE optimiza hiperparámetros bajo restricciones de memoria y latencia, superando métodos tradicionales en problemas costosos.

2026-06-03 · 2 min

Modelo fundacional para datos de movimiento en salud mental

Explora PAT, un modelo fundacional open source para datos de wearables que mejora hasta un 55% la predicción de salud mental, con mapas de atención interpretables.

2026-06-03 · 3 min

Estimación de profundidad y pose monocular auto-supervisada para endoscopia

Descubre cómo la auto-supervisión con priores latentes mejora la precisión en profundidad y pose para endoscopia, superando desafíos de iluminación y texturas.

2026-06-03 · 2 min

Moderación eficiente de LLMs con prototipos latentes multicapa

MLPM, moderador ligero basado en prototipos latentes multicapa, mejora la seguridad de LLMs sin sacrificar eficiencia. Ideal para despliegues personalizados.

2026-06-03 · 1 min

Atención por capas eficiente: poda de recuperaciones redundantes

Descubre cómo ELA, usando divergencia KL y mapeo cuantil beta, reduce un 30% el tiempo de entrenamiento al podar capas redundantes en atención por capas.

2026-06-03 · 2 min

60 artículos sobre marketing en Instagram

Descubre los 60 artículos más leídos sobre marketing en Instagram. Aprende a crecer tu cuenta, usar automatización, influencers y más. ¡Mejora tu estrategia!

2026-06-03 · 2 min

Calendario de contenido social: qué es y por qué usarlo

Descubre qué es un calendario de contenido social y cómo te ayuda a organizar publicaciones, ahorrar tiempo y mejorar el engagement. Optimiza tu estrategia.

2026-06-03 · 2 min