#contrastiva

LOGICA: Alineación contrastiva en espacio de logits para modelos biológicos

Descubre LOGICA: alinea modelos biológicos en espacio de logits para predicción contextual. Mejora clasificación de variantes y resistencia a fármacos.

2026-06-18 · 3 min

Más allá de la tokenización: incrustación directa para QA de series temporales

CADE mejora el QA de series temporales usando incrustación directa y alineación contrastiva, superando la tokenización.

2026-06-18 · 2 min

CAP: Representaciones PPG con supervisión a nivel paciente

CAP mejora la representación PPG al alinear con datos clínicos de pacientes. Logra hasta +87% en predicción respiratoria.

2026-06-16 · 1 min

Políticas condicionadas por dirección para aprendizaje por refuerzo en línea

El método DCP mejora el aprendizaje por refuerzo en línea al condicionar las políticas por dirección, superando a Contrastive RL en manipulación y obstáculos.

2026-06-16 · 2 min

SkillAudit: Evolución de habilidades de IA sin retroalimentación externa

SkillAudit revoluciona la evolución de habilidades en agentes de IA: sin retroalimentación externa, logra un 73.9% de recompensa en tareas. Optimiza tus workflows de IA.

2026-06-15 · 2 min

PCR-CA: Representaciones paralelas y alineación contrastiva para apps

Descubre cómo PCR-CA mejora el CTR un 10.52% con codebooks paralelos y alineación contrastiva para apps multicategoría en Microsoft Store.

2026-06-15 · 1 min

scLLM-DSC: Agrupamiento Estructural Profundo Multimodal con LLM para scRNA-seq

scLLM-DSC mejora el clustering de scRNA-seq integrando conocimiento de LLM y supera 11 métodos. Conoce este avance en bioinformática.

2026-06-12 · 2 min

RLCSD: Aprendizaje por Refuerzo con Autodestilación Contrastiva

RLCSD mejora la autodestilación al contrastar señales con pistas correctas e incorrectas, superando la deriva de estilo y obteniendo mejores resultados que GRPO en razonamiento.

2026-06-11 · 3 min

RLCSD: Aprendizaje por Refuerzo con Autodestilación Contrastiva en Política

RLCSD mejora el razonamiento en modelos de IA al corregir la deriva de estilo inducida por privilegios. Descubre cómo supera a GRPO en tareas lógicas y matemáticas.

2026-06-11 · 2 min

Aprendizaje de manipulación de objetos con interacción contrastiva

Descubre cómo IWR mejora la manipulación robótica con aprendizaje contrastivo, aumentando eficiencia y logrando un agente real de air hockey.

2026-06-11 · 1 min

De Context-Aware a Conflict-Aware: Decodificación Contrastiva para LLMs

Generaliza la decodificación contrastiva del contexto al conflicto, mejorando la fiabilidad de los LLMs.

2026-06-10 · 2 min

TRACE: Marco de asignación de presupuesto para RL agente eficiente

Descubre TRACE, un marco que optimiza la asignación de presupuesto de rollout en RL agente, mejorando el contraste de recompensas y la eficiencia en benchmarks.

2026-06-10 · 1 min

TRACE: Marco de asignación de rollout para RL agente eficiente

Descubre cómo TRACE asigna presupuesto de rollout a nodos prometedores en RL agente multi-turno, mejorando contraste de recompensas y rendimiento.

2026-06-10 · 2 min

MACD: Decodificación Contrastiva Consciente del Modelo

¿Alucinaciones en Video-LLMs? MACD usa datos contrafactuales guiados por el modelo para reducirlas. Mejora la precisión en videos complejos. Descubre más.

2026-06-08 · 1 min