Zhipu AI (Z.ai) liberó su modelo open-weight GLM-5.2, y algunos investigadores han afirmado que iguala a Mythos en ciertos escenarios de búsqueda de bugs y ciberseguridad. Aunque GLM queda por debajo de los modelos de Anthropic y OpenAI en tareas más generales, todo indica que China redujo dramáticamente la distancia en capacidades entre sus modelos y los de Estados Unidos.
¿Por qué preocupa a Washington?
Este nivel de avance resulta especialmente inquietante para el gobierno estadounidense, que ha trabajado para restringir el acceso de China a modelos potentes como Mythos y Fable de Anthropic, además del hardware necesario para entrenarlos y ejecutarlos. La administración Trump considera que Mythos y otros modelos avanzados capaces de identificar vulnerabilidades constituyen una amenaza seria a la seguridad nacional. Recientemente, OpenAI reveló GPT-5.6, un modelo que también levantó preocupaciones por su potencial de mal uso y cuyo acceso está limitado.
¿Qué implica ser open-weight?
Al ser open-weight, GLM puede descargarse y ejecutarse por cualquiera sobre hardware disponible en el mercado. Eso le da gran flexibilidad y permite a usuarios avanzados un nivel profundo de acceso, pero también lo deja expuesto al abuso de actores maliciosos que pueden correrlo con nula supervisión.
Contexto para el mundo hispanohablante
Para equipos de ciberseguridad en Chile y LatAm, la aparición de un modelo open-weight con capacidad cercana a modelos de frontera cerrados en tareas específicas de búsqueda de bugs marca un cambio importante. Los pentesters y bug bounty hunters que hoy pagan 20 a 200 dólares mensuales por acceso a Claude Pro o ChatGPT Plus podrían ejecutar GLM-5.2 en una workstation con dos GPUs de 24 GB, evitando límites de tasa y sin enviar código sensible a terceros.
Los pesos se distribuyen bajo licencia permisiva vía Hugging Face y el modelo Base tiene 355 mil millones de parámetros totales con arquitectura Mixture of Experts, según especificaciones publicadas por Zhipu al momento del release. Un despliegue típico de inferencia con cuantización de 4 bits cabe en 200 GB de VRAM, lo que en la práctica exige un rack con 8 GPUs H100 o equivalente para trabajo serio, o alquilar horas de compute en proveedores especializados.
- Terrence O'Brien




