#activaciones

TWLA: Cuantización post-entrenamiento pesos ternarios y activaciones de bajo bit

Descubre cómo TWLA, mediante cuantización post-entrenamiento, reduce el tamaño y acelera la inferencia de LLMs usando pesos ternarios y activaciones de 4 bits.

2026-06-12 · 2 min

TWLA: Cuantización con pesos ternarios y activaciones de 4 bits

TWLA permite cuantizar LLMs a pesos ternarios y activaciones de 4 bits, reduciendo el costo de inferencia sin perder precisión.

2026-06-12 · 2 min

Evaluación dual de sicofancia: límites de intervención

La intervención en LLMs reduce la sicofancia pero también el acuerdo con verdades. ¿Se puede corregir sin perder precisión?

2026-06-11 · 3 min

ICA Lens: Interpretando modelos de lenguaje sin entrenar otro diccionario

Descubre cómo ICALens usa ICA para encontrar direcciones interpretables en LLMs sin entrenar diccionarios, superando a los SAEs en eficiencia y sondas.

2026-06-11 · 2 min

Recuperables pero no estacionarias: estructuras lineales locales

Estructuras lineales locales en pesos y activaciones son recuperables pero evolucionan rápido, desafiando direcciones de tarea fijas. Estudio con GPT-2 y LoRA.

2026-06-10 · 1 min

Control no lineal de activaciones mediante transformaciones latentes invertibles

Descubre INNSteer: control no lineal de LLMs con transformaciones latentes invertibles que mejora precisión y fluidez sin comprometer la inferencia.

2026-06-09 · 2 min

INNSteer: Control no lineal de LLMs con transformaciones latentes

INNSteer revoluciona el control de modelos de lenguaje al aplicar transformaciones invertibles en el espacio latente, logrando intervenciones no lineales adaptables a cada entrada.

2026-06-09 · 3 min

Transformaciones geométricas de la verdad en LLMs según el contexto

Estudio revela cómo el contexto modifica geométricamente las representaciones de verdad en LLMs. Cambios direccionales y de magnitud separan verdad de falsedad.

2026-06-09 · 1 min

TimpaTeks: Modificación automática de texto in situ con modelos de difusión

Descubre TimpaTeks, una técnica automática para modificar texto en su lugar usando modelos de lenguaje difusivos. Reduce perplexidad y mantiene la estructura sin entrenamiento adicional.

2026-06-09 · 3 min

PRISM: Recuperando conjuntos de instrucciones de activaciones

PRISM decodifica las instrucciones activas en modelos de lenguaje. Un nuevo enfoque para monitorizar agentes de IA ante inyecciones y objetivos ocultos.

2026-06-09 · 2 min

Steering geométrico en modelos de lenguaje: descomposición ángulo-norma

Descubrimos que el control de modelos de lenguaje depende de la interacción entre ángulo y norma. Explicamos por qué los métodos de steering difieren y proponem

2026-06-08 · 3 min

OffQ: Domando outliers en cuantificación de LLMs

Descubre cómo OffQ mitiga los outliers en activaciones para lograr una cuantización W4A4KV4 eficiente sin perder precisión en LLMs.

2026-06-08 · 1 min

De Hackeos de Recompensa a Estados de Riesgo: Monitoreo Contextual en Agentes

Aprende cómo la calibración por contexto y la entropía mejoran la detección de riesgos en agentes LLM frente a hackeos de recompensa.

2026-06-06 · 2 min

Concept-SAE: Interfaz de Conceptos Controlable e Invertible

Descubre cómo Concept-SAE controla conceptos específicos en modelos de IA, mejorando interpretabilidad y detección adversarial.

2026-06-05 · 2 min

Compresión de bajo rango guiada por Pareto y activaciones para LLM/VLM

Optimiza LLM/VLM con compresión de bajo rango informada por activaciones y guiada por Pareto. Logra mayor eficiencia sin sacrificar precisión.

2026-06-05 · 3 min

Aprendizaje de compresión de subespacios para paralelismo eficiente en pipeline

MAPL comprime activaciones en paralelismo de tubería con proyecciones ortogonales aprendidas, reduce comunicación sin pérdida de rendimiento en modelos LLaMA.

2026-06-05 · 3 min

Mitigando la maldición de la dimensionalidad con activaciones suaves

Aprende cómo las redes neuronales con activaciones suaves mitigan la maldición de la dimensionalidad, garantizando convergencia uniforme y robustez en regresión. ¡Entra!

2026-06-05 · 1 min

Aprendizaje activo basado en activaciones: desafíos en aprendizaje en contexto

¿Las activaciones de MLP mejoran el aprendizaje en contexto? Un estudio revela que no. Conoce los hallazgos y el futuro con autoencoders dispersos.

2026-06-04 · 2 min

Capacidades y limitaciones de redes neuronales reales en espacios complejos

Descubre la relación asintótica entre capacidades de redes neuronales reales y complejas en espacios complejos usando la fórmula HCIZ.

2026-06-04 · 2 min

STaR-Quant: Cuantificación post-entrenamiento para modelos de lenguaje difusos

STaR-Quant mejora la cuantificación de baja precisión en DLLMs, logrando 1.69x aceleración y 3.14x ahorro de memoria sobre FP16. Descubre cómo optimizar tu modelo.

2026-06-04 · 2 min