OpenAI presenta Jalapeño, su primer chip de IA hecho con Broadcom

El ASIC diseñado a medida para inferencia llega nueve meses después del anuncio de la sociedad y promete rendimiento por watt mayor al estado del arte actual, según OpenAI.

Publicado el 27 de junio de 2026 · 06:55 p. m.2 min de lectura

Al grano

OpenAI presentó Jalapeño, su primer ASIC de inferencia diseñado en sociedad con Broadcom y enfocado en servir ChatGPT y Codex.

Según Broadcom matchea a las Blackwell de NVIDIA y las TPU de Google; promete mejor rendimiento por watt que el estado del arte.

Despliegue planeado para fines de 2026, nueve meses después del anuncio inicial de la sociedad con Broadcom.

Por qué importa

Jalapeño confirma que ninguno de los grandes laboratorios de IA quiere seguir siendo cliente cautivo de NVIDIA. Lo significativo del anuncio no es el chip en sí (todavía sin benchmarks publicados), sino el ritmo: nueve meses entre la firma con Broadcom y el silicio listo es agresivo incluso para los estándares de Silicon Valley. Si el rendimiento por watt entrega lo prometido, OpenAI puede absorber buena parte de su crecimiento de inferencia sin depender del calendario de Blackwell B200.

OpenAI presentó un nuevo chip "procesador de inteligencia" para servidores de IA fabricado en sociedad con Broadcom. El chip, llamado Jalapeño, está diseñado para impulsar los modelos de lenguaje grande actuales y futuros, según el anuncio publicado este miércoles.

¿Qué es exactamente un ASIC de inferencia?

Jalapeño es un ASIC (Application-Specific Integrated Circuit), lo que significa que está diseñado para un propósito específico: la inferencia de IA. En inferencia, los modelos procesan la solicitud del usuario para ejecutar un agente como Codex u ofrecer una respuesta desde ChatGPT, mientras que el entrenamiento de IA implica que un modelo consuma cantidades enormes de datos para informar sus respuestas.

La distinción es importante porque inferencia y entrenamiento tienen perfiles de carga muy distintos. El entrenamiento favorece chips genéricos con mucho paralelismo (las GPUs Blackwell de NVIDIA dominan ahí). La inferencia, en cambio, premia chips diseñados para una arquitectura específica de modelo, con menor consumo y latencia más baja por consulta. Es el mismo razonamiento que llevó a Google a desarrollar las TPU para servir Search, y a Amazon a fabricar Trainium e Inferentia para AWS.

Nueve meses desde el anuncio hasta el silicio

El chip llega apenas nueve meses después de que OpenAI revelara la sociedad con Broadcom para fabricar chips propios, ayudando a reducir su dependencia de las GPUs de NVIDIA que están en oferta limitada. En una entrevista con Reuters, el CEO de Broadcom Hock Tan afirmó que matchea el rendimiento de los chips Blackwell de NVIDIA y las TPU de Google.

Microsoft, Meta y Amazon están entre las otras empresas de IA que también han lanzado chips diseñados a medida recientemente para impulsar sus servidores, ya sea para entrenamiento o inferencia, mientras todavía quedan atrás de los chips de NVIDIA en rendimiento general.

¿Cuándo se despliega Jalapeño?

OpenAI llama a Jalapeño el "primer paso en una plataforma de cómputo de varias generaciones", que espera desplegar antes de fines de 2026. "Si bien OpenAI todavía está midiendo el rendimiento final, las pruebas tempranas muestran que Jalapeño entregará rendimiento por watt sustancialmente mejor que el estado del arte actual", afirma la empresa en su comunicado.

Esa métrica (performance por watt) es lo único concreto que se anunció. Para escala de datacenter, donde la electricidad puede representar 40% del OpEx según reporte reciente de NVIDIA, una mejora marginal de 10-20% sobre Blackwell sería competitivo. Una mejora de 30%+ cambiaría la economía de servir modelos para ChatGPT a escala.

¿Qué cambia para el mercado de chips de IA?

La industria de chips para IA está volviéndose rápidamente un oligopolio de varios actores que diseñan a medida en lugar de comprar a NVIDIA. Microsoft tiene Maia 100, Meta tiene MTIA 3, Amazon tiene Trainium e Inferentia, Google tiene TPU v6e, y ahora OpenAI tiene Jalapeño.

Para Chile y América Latina el impacto es indirecto pero relevante: si los hyperscalers dependen menos de NVIDIA, la escasez de H100/H200 que ha encarecido el cómputo de IA debería relajarse en 2027-2028. Eso podría bajar el costo de tokens en español ofrecidos vía API en us-east-1 y sa-east-1 (São Paulo), que hoy es típicamente 15-25% más caro que en us-west-2 por la latencia y el routing más largo.

OpenAI presenta Jalapeño, su primer chip de IA hecho con Broadcom

Al grano

Por qué importa

¿Qué es exactamente un ASIC de inferencia?

Nueve meses desde el anuncio hasta el silicio

¿Cuándo se despliega Jalapeño?

¿Qué cambia para el mercado de chips de IA?

Seguir leyendo

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

NVIDIA empuja a las telcos a vender tokens AI en vez de GPU por hora

NVIDIA libera Fleet Intelligence para monitorear sus GPUs

NVIDIA Dynamo: limpiar el header de Claude Code baja 5x la latencia

→Al grano

✦Por qué importa

¿Qué es exactamente un ASIC de inferencia?

Nueve meses desde el anuncio hasta el silicio

¿Cuándo se despliega Jalapeño?

¿Qué cambia para el mercado de chips de IA?

Seguir leyendo

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

NVIDIA empuja a las telcos a vender tokens AI en vez de GPU por hora

NVIDIA libera Fleet Intelligence para monitorear sus GPUs

NVIDIA Dynamo: limpiar el header de Claude Code baja 5x la latencia

Al grano

Por qué importa