OpenAI y Broadcom presentan Jalapeño, su chip para inferencia LLM

El primer Intelligence Processor de OpenAI, fabricado con silicio de Broadcom, llega en despliegue a gran escala a fines de 2026 y Microsoft se comprometería a comprar el 40% de la producción inicial.

Publicado el 25 de junio de 2026 · 12:36 a. m.3 min de lectura

Al grano

OpenAI y Broadcom presentaron Jalapeño, primer chip custom de OpenAI diseñado desde cero para inferencia de LLMs.

Despliegue a escala gigawatt está planificado para fines de 2026, con Microsoft comprometido a comprar 40% de la producción inicial.

OpenAI dice que el ciclo de diseño tomó nueve meses, usando sus propios modelos para acelerar partes del proceso.

Por qué importa

El silicio propio dejó de ser excepción y pasó a ser tabla mínima para jugar en frontier AI. Google lo hizo con TPU, Amazon con Trainium, Meta con MTIA, y ahora OpenAI corona el patrón con un proveedor histórico de switching que se reconvirtió en fábrica de aceleradores. Lo no resuelto es la dependencia simultánea de Broadcom y de TSMC en el fab: la diversificación que OpenAI le quita a NVIDIA, se la pasa a otro cuello de botella.

OpenAI sumó hardware propio a su stack tecnológico. Jalapeño, el chip que desarrolló junto a Broadcom, está pensado específicamente para inferencia de modelos de lenguaje grandes (LLM) y entrará en operación a escala durante la segunda mitad de 2026.

Según el anuncio conjunto, Jalapeño es el primer Intelligence Processor de OpenAI y el primero de una plataforma multigeneracional que ambas empresas construirán en conjunto. El CEO de Broadcom, Hock Tan, y el presidente Charlie Kawwas entregaron la primera oblea al CEO de OpenAI, Sam Altman, y al presidente Greg Brockman. Es el primer paso de OpenAI en hardware custom tras años enfocada en modelos y productos.

¿Qué es exactamente Jalapeño y para qué sirve?

OpenAI sostiene que Jalapeño no es un chip de propósito general modificado, sino un acelerador diseñado desde cero para la inferencia moderna de LLMs. La división del trabajo quedó así: OpenAI lidera el diseño del chip, Broadcom aporta la manufactura de silicio y la tecnología de networking (incluidos sus switches Tomahawk), y Celestica se hace cargo de placas, racks e integración de sistemas.

Las cifras técnicas preliminares que entregó OpenAI hablan de un rendimiento por watt "sustancialmente mejor" que el del hardware actual de referencia. Son números autoreportados y no finalizados, así que conviene tomarlos con cautela. Está pendiente un reporte técnico formal y, por ahora, no se sabe contra qué chips se comparó Jalapeño, en qué tareas ni bajo qué condiciones.

La arquitectura, según OpenAI, reduce el movimiento de datos y empuja la utilización del silicio cerca de su máximo teórico. Las muestras de ingeniería ya están corriendo cargas de machine learning en laboratorio, incluido el modelo GPT-5.3-Codex-Spark, que hoy se ejecuta sobre hardware de Cerebras (otra empresa especializada en inferencia).

¿Por qué importa el ciclo de diseño de nueve meses?

OpenAI asegura que el proceso desde el diseño hasta el tape-out tomó nueve meses, lo que describe como el ciclo más rápido de desarrollo de un ASIC de alto rendimiento del que tienen registro. La propia compañía usó sus modelos para acelerar partes del diseño. Los rumores sobre planes de chip propio de OpenAI circulan desde 2023, así que el calendario público de nueve meses corresponde al sprint final, no al esfuerzo total.

El argumento de fondo es el clásico de quien quiere controlar el stack completo: tener el chip dedicado permite correr modelos más rápido, con más confiabilidad y a menor costo unitario. Es la misma tesis que llevó a Google a fabricar las TPU, a Amazon con Trainium e Inferentia y a Meta con MTIA.

¿Cuándo se despliega y quién compra?

Tan, de Broadcom, dijo que el primer despliegue está planificado para fines de 2026 a escala gigawatt, junto a Microsoft y otros socios. Hay un detalle comercial relevante: Broadcom habría exigido a Microsoft un compromiso de compra del 40% de los chips producidos en la primera fase para asegurar el lanzamiento. Esa garantía blinda a Broadcom de un escenario donde OpenAI atrase la rampa o cambie de proveedor a mitad de camino.

Para Chile y América Latina el efecto inmediato es indirecto: si Jalapeño cumple los números prometidos, podría aliviar parte de la presión sobre la oferta de GPUs NVIDIA H200/B200 que hoy ocupan la mayoría del compute de OpenAI. Eso favorecería a los integradores regionales que dependen de capacidad alquilada de Azure y de proveedores cloud con flotas saturadas.

OpenAI y Broadcom presentan Jalapeño, su chip para inferencia LLM

Al grano

Por qué importa

¿Qué es exactamente Jalapeño y para qué sirve?

¿Por qué importa el ciclo de diseño de nueve meses?

¿Cuándo se despliega y quién compra?

Seguir leyendo

Broadcom exige que Microsoft compre 40% del chip de OpenAI

NVIDIA y Microsoft amplían su stack agentic de Windows al data center

Microsoft y OpenAI eliminan su histórica cláusula AGI del contrato

ASIC de IA en 2026: Broadcom, Google y Meta erosionan el 70% de Nvidia

→Al grano

✦Por qué importa

¿Qué es exactamente Jalapeño y para qué sirve?

¿Por qué importa el ciclo de diseño de nueve meses?

¿Cuándo se despliega y quién compra?

Seguir leyendo

Broadcom exige que Microsoft compre 40% del chip de OpenAI

NVIDIA y Microsoft amplían su stack agentic de Windows al data center

Microsoft y OpenAI eliminan su histórica cláusula AGI del contrato

ASIC de IA en 2026: Broadcom, Google y Meta erosionan el 70% de Nvidia

Al grano

Por qué importa