Nvidia todavía controla aproximadamente el 70% del mercado de chips de IA, pero esa cuota está proyectada a erosionarse a medida que Google, Amazon, Meta, Microsoft y OpenAI invierten miles de millones en silicio diseñado para sus cargas específicas. Los envíos de servidores con ASIC llegarán al 27,8% del mercado en 2026, según un análisis publicado por Tom's Hardware, el share más alto desde 2023.

El informe estima que los envíos de ASIC a medida crecerán 44,6% interanual en 2026, casi triplicando el 16,1% proyectado para GPU comerciales. Todo eso es habilitado casi en su totalidad por TSMC, que fabrica para los cinco hiperescaladores y para Broadcom, el principal arquitecto de chips IA personalizados.

Broadcom: la columna vertebral del ecosistema

Broadcom reportó USD 8.400 millones en ingresos por semiconductores de IA en el Q1 FY2026 (cierre febrero 2026), un alza interanual del 106%, y guió a USD 10.700 millones para el Q2. Su CEO Hock Tan dijo a inversionistas que la empresa tiene "línea de vista para superar los USD 100.000 millones en ingresos por chips de IA en 2027", respaldado por un backlog ya divulgado de USD 73.000 millones.

La cartera de clientes confirmados incluye seis grandes:

  • Google: el socio más antiguo, con siete generaciones de TPU co-diseñadas desde 2014.
  • OpenAI: firmó en octubre de 2025 una colaboración multianual por 10 gigavatios de aceleradores a medida, con primera implementación apuntada a la segunda mitad de 2026 sobre nodos 3nm y 2nm.
  • Meta, ByteDance y Fujitsu completan la lista oficial.

Analistas mencionan a Apple y Arm/SoftBank como compromisos futuros. Por separado, Arm desarrolla un CPU a medida para el acelerador de OpenAI fabricado por Broadcom, contrato que podría valer miles de millones para SoftBank.

La tecnología detrás del crecimiento es la plataforma 3.5D XDSiP de Broadcom, que combina apilamiento 3D cara-a-cara vía SoIC de TSMC con integración 2.5D CoWoS. Permite encapsulados que exceden los 6.000 mm² de silicio con hasta 12 pilas de HBM, muy por sobre el límite de 2.500 mm² de los diseños 2.5D convencionales. En febrero, Broadcom empezó a enviar el primer SoC de cómputo en 2nm de la industria.

Google TPU: el caso más maduro

El programa TPU de Google es el esfuerzo más maduro en silicio custom para IA. El TPU v7, código Ironwood, fue anunciado en Cloud Next de abril 2025 y entró en preview en noviembre. Cada chip entrega:

  • 4.614 TFLOPS FP8 por chip
  • 192 GB de HBM3E con ancho de banda 7,37 TB/s
  • Fabricado en TSMC N3P con diseño dual-chiplet co-desarrollado con Broadcom y MediaTek

La configuración de superpod de 9.216 chips entrega 42,5 exaflops FP8 con 1,77 PB de HBM agregada. SemiAnalysis estima que las TPU logran una utilización sostenida cercana al 90% para transformers, contra 70-80% en GPU, lo que cierra o borra la brecha de rendimiento práctico.

Google asegura que el TCO por chip Ironwood es 44% más bajo que un servidor GB200 según su propia procura. Anthropic se comprometió a hasta un millón de TPU en octubre, el deal más grande en la historia de Google Cloud, mientras Meta entró en conversaciones por despliegues TPU multimillonarios en febrero.

Amazon Trainium: producción masiva y deals con Anthropic y OpenAI

AWS marcó el paso de Google con un roadmap agresivo desarrollado por Annapurna Labs. El Trainium3, disponible desde re:Invent en diciembre, es el primer chip 3nm de AWS:

  • 2,517 PFLOPS FP8 por chip
  • 144 GB HBM3E a 4,9 TB/s
  • El Trn3 UltraServer empaqueta 144 chips entregando 362 petaflops FP8 con 20,7 TB de memoria

El CEO Matt Garman dijo en re:Invent 2025 que la compañía "ya había desplegado más de un millón de procesadores Trainium". El Project Rainier en Indiana, campus de USD 11.000 millones y 2,2 GW, tenía aproximadamente 500.000 Trainium2 corriendo para Anthropic en octubre 2025. AWS también confirmó un deal con OpenAI por 2 GW de capacidad de cómputo Trainium.

El Trainium4 fue anunciado en diciembre 2025 para fines de 2026 o principios de 2027, prometiendo 3× rendimiento FP8 y soporte para Nvidia NVLink Fusion que permite clusters híbridos mezclando Trainium con GPU Nvidia.

¿Cuán ambicioso es el roadmap de Meta MTIA?

Meta develó cuatro nuevas generaciones de MTIA (300 a 500) para despliegue hasta 2027, sumándose a las MTIA 100 y 200 ya en producción. La compañía ya tiene cientos de miles de chips MTIA corriendo inferencia para Facebook e Instagram.

ChipFP8HBMAncho de bandaConsumo
MTIA 4006 PFLOPS288 GB9,2 Tbps1.200 W
MTIA 50010 PFLOPS512 GB27,6 Tbps1.700 W

De la 300 a la 500, el ancho de banda HBM aumenta 4,5× y el cómputo escala 25×, con un nuevo chip cada seis meses aproximadamente. Meta fue explícita en que MTIA no reemplaza a Nvidia: en febrero expandió su partnership con Nvidia por "millones de chips IA" incluyendo Grace Blackwell y futuros Vera Rubin, en un deal reportado en decenas de miles de millones.

Microsoft Maia 200, Tesla cierra Dojo y rezagados

Microsoft desplegó Maia 200 en enero, fabricado en TSMC 3nm con más de 140.000 millones de transistores. Entrega 10 PFLOPS FP4 y 5 PFLOPS FP8 con 216 GB HBM3E a 7 TB/s en 750 W. Microsoft asegura 30% mejor rendimiento por dólar que su mejor hardware previo y dice que es "el silicio first-party más performante de cualquier hiperescalador". Sirve modelos GPT-5.2 para OpenAI y workloads de Microsoft 365 Copilot.

Tesla, en cambio, disolvió el equipo Dojo en agosto. El arquitecto líder Peter Bannon se fue y unos 20 ingenieros fundaron DensityAI. Elon Musk explicó que "una vez que quedó claro que todos los caminos convergen a AI6, tuve que cerrar Dojo". Tesla ahora apunta a chips de inferencia AI5 y AI6, respaldados por un deal de fabricación con Samsung por USD 16.500 millones.

Entre otros, Intel Gaudi 3 sufrió por madurez de software y objetivos perdidos: los goals de envíos se cortaron más del 30% en 2024 y la marca Habana Labs está siendo absorbida por la línea más amplia de aceleradores Intel. En China, Huawei Ascend 910C (SMIC 7nm, ~800 TFLOPS FP16, 128 GB HBM) apunta a 600.000 unidades en 2026 pero enfrenta rendimientos de fabricación del 20%.

¿Por qué TSMC es el verdadero cuello de botella?

TSMC generó USD 122.400 millones en ingresos 2025, un alza interanual del 36%, y proyecta una tasa compuesta anual del 60% en ingresos por chips de IA hasta 2029.

Su capacidad de empaque avanzado CoWoS escala de 65.000-75.000 obleas mensuales en 2025 a un objetivo de 120.000-130.000 en 2026, con capex de hasta USD 56.000 millones planeado para el año. Nvidia se aseguró aproximadamente el 60% de la asignación CoWoS (c. 595.000 obleas), Broadcom el 15% (c. 150.000) y AMD el 11% (c. 105.000).

Cada ASIC custom en este informe depende de CoWoS o su sucesor CoWoS-L para integración de HBM. La capacidad de empaque de TSMC es hoy una restricción más vinculante que la fabricación de obleas misma.

Deloitte proyectó que las cargas de inferencia llegarán a representar dos tercios de todo el cómputo de IA este año. Con una ventaja TCO del silicio custom de hasta 65% sobre GPU convencionales para inferencia a escala de producción, queda claro por qué tantos hiperescaladores apuestan a sus propios ASIC. Broadcom y Marvell juntos controlan cerca del 95% del mercado de co-diseño.