Mientras Estados Unidos y China pelean por la supremacía en inteligencia artificial, una división fundamental de filosofía de ingeniería podría definir al ganador.

Mientras pioneros estadounidenses como OpenAI y Anthropic favorecen un enfoque cerrado (manteniendo el código de sus modelos propietarios detrás de una interfaz comercial), los laboratorios chinos están liberando modelos open source con agresividad. Esa estrategia permite a los desarrolladores descargar, inspeccionar y customizar a fondo el código subyacente gratis, en vez de quedar dependientes del ecosistema de un gigante tecnológico estadounidense.

Tiezhen Wang, ex jefe del ecosistema Asia-Pacífico en la plataforma de colaboración de la comunidad de IA Hugging Face, ha observado esta tendencia a lo largo de los años. Antes de dejar Hugging Face en mayo, asistió a laboratorios de IA de la región en el lanzamiento de modelos open source y ayudó a investigadores a que sus modelos fueran más fáciles de usar para los desarrolladores.

En un evento virtual de Rest of World, Wang habló sobre la historia de los modelos open source, cómo monetizan los laboratorios chinos pese a no cobrar por sus modelos y el debate sobre destilación y propiedad intelectual.

La conversación fue editada por longitud y claridad. La grabación del evento en vivo está acá.

¿Cuál es el rol de los modelos open source en la competencia IA entre China y EE.UU.?

Mucha gente habla de la competencia en IA. Pero en el mundo open source mantenemos una mentalidad colaborativa.

Muchos releases open source de los labs chinos están ayudando a los labs estadounidenses. Por ejemplo, el algoritmo de entrenamiento de reinforcement learning de DeepSeek se está volviendo el setting por defecto para muchos labs de investigación en EE.UU. Muchos pesos open source chinos corren sobre hardware estadounidense.

Es como ayudarse mutuamente, no competir como un juego de suma cero. Podemos ser ambos ganadores si hacemos crecer el pastel juntos.

OpenAI y Anthropic acusaron a empresas chinas de destilar sus modelos. ¿Cómo lo ves como defensor del open source?

Destilación es una palabra neutra en el mundo de la investigación. Es como si yo leyera un libro y le contara a alguien de qué trata. La otra persona también entiende lo que el libro dice. Eso es básicamente destilación.

Se ha hecho mucho en laboratorios de investigación. No creo que destilar por sí mismo sea algo malo, y creo que en EE.UU. también se destilan entre ellos. Recientemente vimos a Elon Musk admitir que xAI destiló desde OpenAI.

Es de público conocimiento que Anthropic y ChatGPT están crawleando internet, recolectando todo tipo de información. Entonces es interesante ver que quienes no generaron conocimiento intentan impedir que otros lo reutilicen.

Todo contenido generado por IA debería tener cero copyright, de lo contrario quienes tienen cómputo pueden abusar y generar todo tipo de combinaciones y copyright sobre todo.

¿Cómo difiere la monetización entre modelos abiertos y cerrados?

Si haces open source de tu modelo, es difícil ganar plata directamente. Pero igual se puede.

Por ejemplo, Kimi de China liberó su modelo gratis, pero su API y suscripción siguen con demanda alta porque tienen el mejor soporte de infraestructura.

Una vez que un modelo se libera como open source, la gente tiene que gastar horas de ingeniería para correrlo. Entonces, en el día cero, el laboratorio que lo lanzó tiene ventaja. Esa es una forma de ganar plata.

Otra forma es, por ejemplo, que Kimi libere un modelo fine-tuned como open source pero se quede con los modelos base, que sí puede vender.

Si queremos pensar por qué un laboratorio de investigación haría open source de sus modelos, es para construir su branding. Cuando recién empiezas un laboratorio, ¿por qué un investigador querría trabajar para ti? Es muy difícil reclutar top talent. Pero si tienes buenos modelos open source, todo el mundo sabe que hiciste buen trabajo.

¿Por qué algunos labs chinos están retrocediendo del open source?

Algunos modelos están cambiando sus licencias. Por ejemplo, Minimax cambió la licencia para básicamente decir que si usas este modelo para hacer dinero, tienes que pagar. Es una práctica muy común en el mundo open source, sobre todo si quieres prevenir free riders como los usuarios cloud.

Los proveedores cloud podrían correr un modelo open source gratis y generar ganancia sin compartirla con el laboratorio. Es injusto.

La tendencia de los cambios es: si eres un usuario individual, puedes usar mi modelo gratis para siempre, pero si eres un proveedor cloud generando ingresos al servir mi modelo, tienes que darme una porción de tu ganancia. Creo que es justo y de hecho una forma sustentable de apoyar al open source.

¿Más labs chinos se cerrarán por problemas de monetización?

Estoy preocupado. Si no encuentran cómo monetizar su investigación, ese es un riesgo real. Si pueden tener dinero y seguir haciendo open source, sería bueno para todos.

El mercado de capitales está empezando a ayudar. Si miras el precio de la acción de Zhipu, ya está 10 veces más arriba. Eso definitivamente les ayudará a adquirir más cómputo, talento y datos, y a generar mejores modelos. Estas inversiones pueden mantener a los labs en la mesa por más tiempo.

A una startup de EE.UU., ¿le recomendarías modelos americanos, chinos o el mejor open source?

Es una estrategia conocida: hoy en EE.UU., si querés lanzar una startup, el primer paso es encontrar el modelo con mejor product-market fit. Eso es más importante que tu decisión técnica. Si tu producto no satisface una demanda fuerte, la startup va a fallar. Esos modelos suelen ser closed source.

Pero una vez que tienes el modelo cerrado y un primer grupo de usuarios, estás acumulando data. Sabes cómo se usa tu producto. Más adelante puedes usar esa data para entrenar tu propio modelo. Ahí las empresas empiezan a considerar pasarse a un open source. Eventualmente podrías ahorrar cien veces en tokens.

Volviste de un viaje a China. ¿Qué observaciones nuevas traes?

Tuve un viaje muy interesante hablando con varios labs y empresas que generan tokens. Siento que el mercado chino entero está madurando rápido.

EE.UU. claramente está haciendo un gran trabajo explorando lo que puede hacer la IA, pero el token allá es más caro incluso para empresas grandes. Por ejemplo, Uber quemó los tokens de todo un año en cuatro meses. Microsoft también dijo que sentía los tokens más caros de lo esperado.

En China es un poco al revés porque hay un montón de modelos open source que no son tan caros de usar.

En cuanto los modelos open source chinos crucen un punto usable, el uso crecerá exponencialmente. Lo que vi es que todas las empresas de internet chinas empezaron a tokenmaxxing, que básicamente es darle a sus empleados tokens ilimitados solo para ver qué pueden hacer. Escuché que algunas grandes tecnológicas chinas están forzando a sus empleados a ser AI-native y prohibiéndoles cosas normales como escribir un documento.

Este tipo de adopción es mucho más rápido que lo que hizo EE.UU. No me sorprendería si en uno o dos años ves casos de uso y adopción de IA muy interesantes en China.