El supercomputador chino LineShine se quedó con el primer lugar de la edición 67 del TOP500, anotando 2,198 exaflops en el benchmark High Performance Linpack y desplazando al estadounidense El Capitan al segundo puesto por más de 20% de diferencia. El sistema, instalado en el National Supercomputing Centre en Shenzhen, no usó ningún GPU ni acelerador y alcanzó la cifra con 13.789.440 núcleos de silicio diseñado en China. Es la primera máquina del ranking en cruzar los 2 exaflops de FP64 solo con CPUs, y el primer sistema chino en liderar el TOP500 desde el Sunway TaihuLight en 2017.
¿Qué hardware tiene LineShine adentro?

LineShine corre sobre lo que NSCS llama plataforma LingKun. Cada uno de sus 20.480 nodos de cómputo lleva dos procesadores LX2, partes basadas en Armv9 con 304 núcleos a 1,55 GHz, organizados en ocho clústeres de 38 núcleos. Cada núcleo incluye las extensiones SVE (Scalable Vector Extension) y SME (Scalable Matrix Extension) de Arm, cubriendo FP64, FP32, BF16, FP16 e INT8.
Cada LX2 combina 32 GB de HBM en paquete con ancho de banda de hasta 4 TB/s, más hasta 256 GB de DDR5 fuera del paquete. La arquitectura se parece más al A64FX de Fujitsu en el japonés Fugaku que a un CPU de servidor convencional. Los nodos se interconectan vía la red propietaria LingQi y el sistema corre el sistema operativo Kylin OS, también doméstico.
No se sabe quién diseña el LX2 — NSCS no nombra proveedor — pero Jon Peddie Research lo atribuye a Huawei, y la fase piloto del proyecto corrió en servidores Huawei Kunpeng. El nodo de fabricación y la foundry tampoco están confirmados: el proceso 7nm de SMIC es el candidato doméstico obvio por descarte, dado que EUV y capacidad TSMC están fuera de la mesa.
¿Y en cargas de IA?

LineShine también lideró el benchmark HPCG (que premia cargas memory-bound más cercanas a código científico real) con 22,00 petaflops. Pero en HPL-MxP, el benchmark de precisión mixta que aproxima la matemática del entrenamiento de IA, quedó en cuarto lugar con 7,92 exaflops, apenas 3,6 veces su score FP64.
Las máquinas con aceleradores que LineShine venció en Linpack se disparan al bajar la precisión:
- El Capitan: 16,7 exaflops en HPL-MxP, 9,2x su resultado FP64
- Aurora y Frontier: multiplicadores similares
- LineShine: solo 3,6x
El throughput a precisión reducida es exactamente donde GPUs y APUs se separan de los CPUs, y LineShine no tiene dónde esconderse en esa pista.
¿Cuánto consume?
LineShine consume 42.220 kW y entrega 52,07 gigaflops por watt en su corrida Linpack. Supera cómodamente al Intel Aurora, pero queda por debajo de los 60,94 gigaflops por watt de El Capitan. En la práctica: produce más output FP64 que el sistema de Livermore quemando aproximadamente 42% más potencia para hacerlo.
¿Por qué China envió ahora este sistema?
China dejó de enviar sus sistemas más rápidos al TOP500 alrededor de 2021, después de una serie de adiciones a la entity list que golpeó al centro Wuxi de Sunway y a Sugon. La comunidad cree desde hace años que el país opera hardware exascale fuera del ranking: el sucesor del Sunway, OceanLight, y el Tianhe-3 construido por NUDT aparecieron en papers premiados con Gordon Bell sin entrar al TOP500.
Que LineShine entre ahora sí es un cambio deliberado de postura. Se reportó que el sistema fue desarrollado sin financiamiento público, lo que reduce la exposición política de revelarlo, y el diseño 100% doméstico significa que no hay dependencia de partes occidentales que Washington pueda cortar después.
Addison Snell, CEO de la firma de análisis HPC Intersect360 Research, dijo a Reuters que no le sorprendió el rendimiento sino la decisión de mostrarlo, notando que la sorpresa fue que China quisiera el reconocimiento. Enviar un sistema número uno que corre 100% en partes indígenas es una declaración de que el régimen de sanciones no cerró la brecha que a China le importa.
¿Cómo queda AMD en el resto del ranking?
El tope cambió de manos pero el grueso del TOP500 no. EE.UU. domina con tres de los cinco primeros: El Capitan (1,809 exaflops), Frontier (1,353) y Aurora (1,012). El JUPITER Booster alemán sigue siendo el único sistema exascale europeo en exactamente 1,000 exaflops.
AMD está debajo de la mayoría del campo acelerado: 191 sistemas en el ranking (11% más año a año) y el 41% de los nuevos ingresos. Tiene tres slots en el top 10 — El Capitan, Frontier y el recién desplegado HPC7 en la firma energética italiana Eni — y contribuye más del 40% del rendimiento Linpack combinado del top 10. En eficiencia, AMD impulsa el 56% de los top 50 del Green500.




