OpenAI presentó un nuevo chip "procesador de inteligencia" para servidores de IA fabricado en sociedad con Broadcom. El chip, llamado Jalapeño, está diseñado para impulsar los modelos de lenguaje grande actuales y futuros, según el anuncio publicado este miércoles.
¿Qué es exactamente un ASIC de inferencia?
Jalapeño es un ASIC (Application-Specific Integrated Circuit), lo que significa que está diseñado para un propósito específico: la inferencia de IA. En inferencia, los modelos procesan la solicitud del usuario para ejecutar un agente como Codex u ofrecer una respuesta desde ChatGPT, mientras que el entrenamiento de IA implica que un modelo consuma cantidades enormes de datos para informar sus respuestas.
La distinción es importante porque inferencia y entrenamiento tienen perfiles de carga muy distintos. El entrenamiento favorece chips genéricos con mucho paralelismo (las GPUs Blackwell de NVIDIA dominan ahí). La inferencia, en cambio, premia chips diseñados para una arquitectura específica de modelo, con menor consumo y latencia más baja por consulta. Es el mismo razonamiento que llevó a Google a desarrollar las TPU para servir Search, y a Amazon a fabricar Trainium e Inferentia para AWS.
Nueve meses desde el anuncio hasta el silicio
El chip llega apenas nueve meses después de que OpenAI revelara la sociedad con Broadcom para fabricar chips propios, ayudando a reducir su dependencia de las GPUs de NVIDIA que están en oferta limitada. En una entrevista con Reuters, el CEO de Broadcom Hock Tan afirmó que matchea el rendimiento de los chips Blackwell de NVIDIA y las TPU de Google.
Microsoft, Meta y Amazon están entre las otras empresas de IA que también han lanzado chips diseñados a medida recientemente para impulsar sus servidores, ya sea para entrenamiento o inferencia, mientras todavía quedan atrás de los chips de NVIDIA en rendimiento general.
¿Cuándo se despliega Jalapeño?
OpenAI llama a Jalapeño el "primer paso en una plataforma de cómputo de varias generaciones", que espera desplegar antes de fines de 2026. "Si bien OpenAI todavía está midiendo el rendimiento final, las pruebas tempranas muestran que Jalapeño entregará rendimiento por watt sustancialmente mejor que el estado del arte actual", afirma la empresa en su comunicado.
Esa métrica (performance por watt) es lo único concreto que se anunció. Para escala de datacenter, donde la electricidad puede representar 40% del OpEx según reporte reciente de NVIDIA, una mejora marginal de 10-20% sobre Blackwell sería competitivo. Una mejora de 30%+ cambiaría la economía de servir modelos para ChatGPT a escala.
¿Qué cambia para el mercado de chips de IA?
La industria de chips para IA está volviéndose rápidamente un oligopolio de varios actores que diseñan a medida en lugar de comprar a NVIDIA. Microsoft tiene Maia 100, Meta tiene MTIA 3, Amazon tiene Trainium e Inferentia, Google tiene TPU v6e, y ahora OpenAI tiene Jalapeño.
Para Chile y América Latina el impacto es indirecto pero relevante: si los hyperscalers dependen menos de NVIDIA, la escasez de H100/H200 que ha encarecido el cómputo de IA debería relajarse en 2027-2028. Eso podría bajar el costo de tokens en español ofrecidos vía API en us-east-1 y sa-east-1 (São Paulo), que hoy es típicamente 15-25% más caro que en us-west-2 por la latencia y el routing más largo.




