Meta está limitando cómo sus ingenieros usan Claude Code de Anthropic y Codex de OpenAI para evitar que las salidas de esas herramientas terminen alimentando su propio dataset de entrenamiento. La información proviene de documentos internos revisados por The Information y publicada esta semana por The Decoder.

¿Qué prohíbe exactamente Meta?

La política interna, según los documentos, prohíbe a los ingenieros usar salidas de modelos de IA de terceros para crear tareas de prueba, para análisis de código o para generar cualquier artefacto que pudiera terminar mezclado con datos de entrenamiento. La revisión humana sigue siendo requisito obligatorio en todo el flujo. La empresa incluso pausó de forma temporal ciertos trabajos con esas herramientas mientras redefinía los procedimientos.

¿Por qué el pánico interno?

La palabra clave es distillation, la transferencia no autorizada de capacidades desde un modelo rival hacia otro. Un memo interno advierte de "escaladas serias con las empresas partner" si las salidas de sus modelos llegaran a filtrarse dentro del dataset de entrenamiento de Meta. Los términos de servicio de OpenAI, Anthropic y Google prohíben explícitamente usar salidas de modelos para construir sistemas competidores, y en los últimos meses la industria vio movimientos concretos en esa dirección.

Anthropic acusó recientemente a Alibaba del ataque de distillation más grande conocido hasta la fecha, y en abril Elon Musk debió admitir que xAI distilló parcialmente modelos de OpenAI para acelerar el entrenamiento de Grok. La disputa es cada vez menos hipotética.

MetaCode, el asistente propio

Meta está construyendo MetaCode, su propio asistente de codificación interno, y quiere reducir la dependencia de herramientas externas, en parte por los costos crecientes. Un memo interno indica que la compañía está en camino a gastar miles de millones de dólares en uso interno de IA solo durante este año. La cifra explica por qué la conversación no es solo defensiva ante los partners sino económica: cortar la dependencia externa alivia el capex operativo.

Contexto: distillation como fricción industrial

El fenómeno distillation está generando roces en toda la industria. La técnica no requiere acceso a los pesos del modelo original: basta con recolectar suficientes pares entrada-salida para reentrenar un modelo más pequeño que replica gran parte del comportamiento. En términos de compliance, los proveedores dependen casi enteramente de que sus clientes respeten los términos de uso. La visibilidad efectiva sobre qué se hace con las salidas es limitada.

Meta declaró públicamente que tiene reglas claras para el uso responsable de herramientas de IA. Anthropic, OpenAI y Google no comentaron sobre los detalles del caso, aunque los tres tienen cláusulas que prohíben explícitamente el uso de outputs para construir modelos competidores.

Impacto para devs y empresas en LatAm

Para equipos de desarrollo en Chile y LatAm el episodio tiene una lectura práctica. Si el empleador construye modelos propios o participa en cadenas donde otros lo hacen, conviene revisar los términos de uso de las herramientas IA que usa el equipo día a día. La sombra jurídica sobre outputs generados no es teórica: las cláusulas están ahí y los proveedores están dispuestos a hacerlas valer.