OpenAI sumó hardware propio a su stack tecnológico. Jalapeño, el chip que desarrolló junto a Broadcom, está pensado específicamente para inferencia de modelos de lenguaje grandes (LLM) y entrará en operación a escala durante la segunda mitad de 2026.
Según el anuncio conjunto, Jalapeño es el primer Intelligence Processor de OpenAI y el primero de una plataforma multigeneracional que ambas empresas construirán en conjunto. El CEO de Broadcom, Hock Tan, y el presidente Charlie Kawwas entregaron la primera oblea al CEO de OpenAI, Sam Altman, y al presidente Greg Brockman. Es el primer paso de OpenAI en hardware custom tras años enfocada en modelos y productos.
¿Qué es exactamente Jalapeño y para qué sirve?
OpenAI sostiene que Jalapeño no es un chip de propósito general modificado, sino un acelerador diseñado desde cero para la inferencia moderna de LLMs. La división del trabajo quedó así: OpenAI lidera el diseño del chip, Broadcom aporta la manufactura de silicio y la tecnología de networking (incluidos sus switches Tomahawk), y Celestica se hace cargo de placas, racks e integración de sistemas.
Las cifras técnicas preliminares que entregó OpenAI hablan de un rendimiento por watt "sustancialmente mejor" que el del hardware actual de referencia. Son números autoreportados y no finalizados, así que conviene tomarlos con cautela. Está pendiente un reporte técnico formal y, por ahora, no se sabe contra qué chips se comparó Jalapeño, en qué tareas ni bajo qué condiciones.
La arquitectura, según OpenAI, reduce el movimiento de datos y empuja la utilización del silicio cerca de su máximo teórico. Las muestras de ingeniería ya están corriendo cargas de machine learning en laboratorio, incluido el modelo GPT-5.3-Codex-Spark, que hoy se ejecuta sobre hardware de Cerebras (otra empresa especializada en inferencia).
¿Por qué importa el ciclo de diseño de nueve meses?
OpenAI asegura que el proceso desde el diseño hasta el tape-out tomó nueve meses, lo que describe como el ciclo más rápido de desarrollo de un ASIC de alto rendimiento del que tienen registro. La propia compañía usó sus modelos para acelerar partes del diseño. Los rumores sobre planes de chip propio de OpenAI circulan desde 2023, así que el calendario público de nueve meses corresponde al sprint final, no al esfuerzo total.
El argumento de fondo es el clásico de quien quiere controlar el stack completo: tener el chip dedicado permite correr modelos más rápido, con más confiabilidad y a menor costo unitario. Es la misma tesis que llevó a Google a fabricar las TPU, a Amazon con Trainium e Inferentia y a Meta con MTIA.
¿Cuándo se despliega y quién compra?
Tan, de Broadcom, dijo que el primer despliegue está planificado para fines de 2026 a escala gigawatt, junto a Microsoft y otros socios. Hay un detalle comercial relevante: Broadcom habría exigido a Microsoft un compromiso de compra del 40% de los chips producidos en la primera fase para asegurar el lanzamiento. Esa garantía blinda a Broadcom de un escenario donde OpenAI atrase la rampa o cambie de proveedor a mitad de camino.
Para Chile y América Latina el efecto inmediato es indirecto: si Jalapeño cumple los números prometidos, podría aliviar parte de la presión sobre la oferta de GPUs NVIDIA H200/B200 que hoy ocupan la mayoría del compute de OpenAI. Eso favorecería a los integradores regionales que dependen de capacidad alquilada de Azure y de proveedores cloud con flotas saturadas.




