Etiqueta

#qwen

13 notas publicadas

Modelos abiertos chinos retan el manual de Silicon Valley

Z.ai, Moonshot y Alibaba lanzaron GLM 5.2, Kimi K3 y Qwen 3.8 con pesos abiertos y rendimiento casi de frontera, justo cuando los laboratorios estadounidenses se vuelven más cerrados.

Wiredhace 3 días

Kimi K3 y el giro de China hacia la IA de codigo abierto

Un repaso al estado de los modelos abiertos: Kimi K3, el anuncio de Qwen de liberar pesos, el respaldo de Xi Jinping al open source y cuanto falta para alcanzar a la frontera cerrada.

Interconnectshace 3 días

Qwen Audio 3.0 TTS Plus lidera el ranking de texto a voz

El modelo de Alibaba encabeza la Speech Arena de Artificial Analysis con 1.236 puntos Elo, apenas dos por encima de Simba 3.2, aunque su velocidad de generación queda muy por debajo de la competencia.

The Decoderhace 4 días

Qwen-Image-3.0 de Alibaba: texto legible de diez pixeles

La tercera version del generador de Alibaba maqueta diarios, papers en LaTeX y grillas de infografias en una sola pasada, pero llega cerrada y solo por invitacion a la API.

The Decoderhace 4 días

Qwen 3.8: Alibaba planta cara a Kimi K3 con pesos abiertos

El modelo multimodal de 2,4 billones de parametros llega en version preview y busca frenar el impulso de Kimi K3 antes de que Moonshot AI salga a bolsa.

The Decoder19 jul

Apple Intelligence llega a China con la IA Qwen de Alibaba

El regulador chino aprobo los servicios de IA de Apple tras un acuerdo para integrar el modelo Qwen de Alibaba en iOS, iPadOS, macOS y visionOS.

TechCrunch16 jul

Bonsai 27B, el modelo de razonamiento abierto que cabe en un iPhone

PrismML comprimió un modelo de 27.000 millones de parámetros a menos de 4 GB conservando cerca del 90% del rendimiento, y Apple ya estaría probando la tecnología para su IA en el dispositivo.

The Decoder15 jul

Ahmad Osman: la IA local está a 4-8 meses de los modelos frontier

El fundador de Osmantic dio dos talleres en el AI Engineer World's Fair sobre cómo desplegar LLM open source en workstations propias, con público que fue de estudiantes a ejecutivos de Intel.

Latent Space3 jul

Electrónica

Dos mini PCs locales para 50 millones de tokens al día

Un periodista de tecnología cuenta cómo armó un stack casero con un AMD Ryzen AI Max+ 395 de 96 GB para correr Qwen3.5 sin pagar APIs frontera.

Tom's Hardware19 jun

TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU

El motor open source de LightSeek, escrito desde cero en SPMD con compilacion estatica, ataca workloads agenticos con prefix cache hibrido y disaggregacion prefill-decode para Mamba.

PyTorch Blog28 may

ByteDance: preguntar a un LMM enseña mejor que transcribir

MMProLong, un modelo de 7B parámetros, supera a InternVL3-38B y Gemma3-27B en documentos de hasta 512.000 tokens entrenándose con pares pregunta-respuesta en vez de OCR puro.

The Decoder25 may

Qwen3.7-Max corrió 35 horas solo para optimizar el chip propio de Alibab

El nuevo modelo del equipo Qwen, exclusivo de la API de Alibaba Cloud, completó 432 tests de kernel y 1.158 tool calls sin intervención humana, logrando un speedup promedio de 10x.

The Decoder23 may

Qwen-Image-2.0: Alibaba dobla compresión y cae a 4 pasos

El reporte técnico del modelo de imagen de Alibaba detalla un VAE con compresión 16x, un transformer reentrenado con SwiGLU y un módulo de prompts que expande textos cortos a descripciones ricas.

The Decoder15 may

Etiquetas relacionadas

Otros temas que aparecen junto a #qwen en nuestra cobertura editorial.

#LLM7 #Alibaba6 #modelos-abiertos3 #china3 #kimi-k33 #Open Source2 #multimodal2 #Apple2