El ecosistema de modelos abiertos ya no está capturado por un puñado de laboratorios chinos. Es la lectura de fondo de la edición #22 del boletín Latest open artifacts de Interconnects, escrito por Nathan Lambert, que agrupa los lanzamientos abiertos más relevantes de las últimas semanas.
¿Quiénes están liberando modelos y por qué?

Lambert distingue tres tipos de actores dentro del ecosistema abierto:
- Fabricantes puros de modelos: apuntan a la frontera. Aquí caen las chinas DeepSeek, Zhipu y MiniMax, junto a las occidentales Poolside, Arcee y Zyphra. Suma también a los actores de IA soberana: Cohere, Mistral y Trillion Labs.
- Big Tech: Alibaba (Qwen), Google (Gemma) y en parte NVIDIA. Alibaba usa el abierto como upsell hacia sus modelos cerrados; NVIDIA se beneficia porque una comunidad open source activa consume más GPUs.
- Empresas de producto: JetBrains, Zed, Krea y Photoroom. Venden productos con IA como componente central y entrenan modelos chicos y especializados que sí pueden liberar sin dañar su negocio.
Esa diversidad respalda la hipótesis del propio Lambert: en los próximos años habrá una cola larga de modelos abiertos y menos empresas persiguiendo la frontera absoluta.
Modelos destacados de la ronda #22

- NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 de NVIDIA: la versión grande de la serie Nemotron, con arquitectura LatentMoE para mayor velocidad que modelos comparables. Casi todos los datos son abiertos y NVIDIA adopta la licencia OpenMDW, diseñada específicamente para pesos y datos de modelos y no para software, como sí lo son MIT o Apache.
- command-a-plus-05-2026-bf16 de Cohere Labs: el flagship de la casa canadiense pasa a Apache 2.0. Es un 218B-A25B MoE multimodal, multilingüe y con capacidades agenticas, ejecutable en una sola B200 con cuantización a 4 bits.
- GLM-5.2 de zai-org: es la nota grande de esta ronda; según Lambert, es "genuinamente usable para trabajo cotidiano, no muy lejos de los mejores modelos cerrados disponibles". Los descargas iniciales acompañan el ritmo de GLM-5.
- ZAYA1-74B-preview de Zyphra: un 74B-A4B MoE entrenado sobre GPUs AMD, con un tech report con decisiones de arquitectura poco convencionales. También llegó un 8B-A0.6B MoE hermano menor.
- Laguna-M.1 de Poolside: el flagship se libera bajo Apache 2.0 y la empresa anunció que los pesos abiertos son ahora su default, con compromiso de liberar modelos cada vez más capaces.
En la categoría de propósito general aparecen Kimi-K2.7-Code de Moonshot AI (foco en eficiencia por token), Step-3.7-Flash de StepFun (fuerte en matemáticas) y Nemotron-Labs-Diffusion-14B, un experimento de NVIDIA que corre en tres modos: autoregresivo, difusión y auto-especulación.
Contexto LATAM
Para equipos técnicos en Chile y la región, el punto práctico es que los modelos de esta ronda son fine-tuneables y desplegables sin licencia comercial adicional. Command A+ (218B) corre en una GPU B200 con 4-bit; para experimentar con GLM-5.2 basta con una tarjeta de datacenter H100 o un cluster pequeño de A100. Poolside también publicó Laguna-M.1 bajo Apache 2.0, lo que la hace apta para servicios comerciales sin fricciones legales, un detalle relevante para startups chilenas que están cerrando contratos B2B.




