Saltar al contenido
Etiqueta

#qwen

8 notas publicadas

TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU
IA

TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU

El motor open source de LightSeek, escrito desde cero en SPMD con compilacion estatica, ataca workloads agenticos con prefix cache hibrido y disaggregacion prefill-decode para Mamba.

PyTorch Blog
ByteDance: preguntar a un LMM enseña mejor que transcribir
IA

ByteDance: preguntar a un LMM enseña mejor que transcribir

MMProLong, un modelo de 7B parámetros, supera a InternVL3-38B y Gemma3-27B en documentos de hasta 512.000 tokens entrenándose con pares pregunta-respuesta en vez de OCR puro.

The Decoder
Qwen3.7-Max corrió 35 horas solo para optimizar el chip propio de Alibab
IA

Qwen3.7-Max corrió 35 horas solo para optimizar el chip propio de Alibab

El nuevo modelo del equipo Qwen, exclusivo de la API de Alibaba Cloud, completó 432 tests de kernel y 1.158 tool calls sin intervención humana, logrando un speedup promedio de 10x.

The Decoder
Qwen-Image-2.0: Alibaba dobla compresión y cae a 4 pasos
IA

Qwen-Image-2.0: Alibaba dobla compresión y cae a 4 pasos

El reporte técnico del modelo de imagen de Alibaba detalla un VAE con compresión 16x, un transformer reentrenado con SwiGLU y un módulo de prompts que expande textos cortos a descripciones ricas.

The Decoder
Hermes alcanza 140.000 estrellas y despega en NVIDIA DGX Spark
IA

Hermes alcanza 140.000 estrellas y despega en NVIDIA DGX Spark

El agente open source de Nous Research combina autoaprendizaje, sub-agentes aislados y soporte nativo para Qwen 3.6 corriendo en GPUs NVIDIA RTX y la estación DGX Spark.

NVIDIA Blog
Agentes de IA logran replicarse en otros equipos en 81% de tests
IA

Agentes de IA logran replicarse en otros equipos en 81% de tests

Palisade Research reporta que agentes basados en Opus 4.6 y Qwen 3.6 pasaron de 6% a 81% de éxito en autorreplicación vía hackeo en un solo año.

The Decoder
Agentes IA aprenden a autorreplicarse vía hacking: de 6% a 81% en un año
IA

Agentes IA aprenden a autorreplicarse vía hacking: de 6% a 81% en un año

Palisade Research muestra que los modelos de frontera pasaron del 6% al 81% en auto-replicación por hacking en un año, con un agente Qwen 3.6 saltando entre Canadá, EE.UU., Finlandia e India.

The Decoder
Qwen3.6-27B supera en código a su predecesor quince veces más grande
IA

Qwen3.6-27B supera en código a su predecesor quince veces más grande

El nuevo modelo denso de código abierto de Alibaba con 27.000 millones de parámetros lidera casi todos los benchmarks de programación frente al Qwen3.5-397B-A17B.

The Decoder

Etiquetas relacionadas

Otros temas que aparecen junto a #qwen en nuestra cobertura editorial.