LineShine, el nuevo supercomputador chino que lidera el Top500
LineShine, el nuevo supercomputador chino que lidera el Top500

El supercomputador LineShine de China destronó a El Capitan como número uno mundial al subir directo a la cima tras la publicación de resultados por parte del National Supercomputer Center in Shenzhen (NSCS).

LineShine alcanzó 2,198 ExaFLOPS FP64 en el benchmark Linpack y se convirtió en la primera máquina del Top500 capaz de sostener más de 2 ExaFLOPS de doble precisión usando exclusivamente CPUs. El sistema está desplegado en el centro de Shenzhen y fue construido por el Shenzhen Cloud Computing Center con procesadores semi-custom LX2 de 304 núcleos basados en la arquitectura Armv9 y corriendo a 1,55 GHz.

La máquina emplea 13,79 millones de núcleos en total, usa el interconnect propietario LingQi y consume 42,2 MW de potencia.

¿Qué tan eficiente es LineShine frente a El Capitan?

Desde el punto de vista de rendimiento por watt, LineShine entrega 52,07 GFLOPS/W, una cifra por debajo de los 60,94 GFLOPS/W de El Capitan. Sin embargo, LineShine supera ampliamente a Fugaku, otro supercomputador all-CPU que en su momento lideró el HPC y que solo entrega entre 14,78 y 16,84 GFLOPS/W según el modo de optimización.

LineShine también pasó al primer lugar del ranking HPCG con 22,00 HPCG-PFLOPS. Pero en el benchmark HPL-MxP de precisión mixta alcanzó 7,92 EFLOPS, quedando por detrás de El Capitan, Frontier y Aurora. Esta limitación reduce su utilidad para entrenamiento e inferencia de IA, aunque se justifica con el rendimiento excepcional en tareas tradicionales de supercómputo como simulaciones científicas, dinámica molecular y modelado climático.

¿Cómo es por dentro el procesador LX2?

Cada CPU LX2 se apoya en dos chiplets de cómputo y suma 304 núcleos organizados en ocho clusters de 38 núcleos cada uno. Cada núcleo incluye unidades Arm SVE (Scalable Vector Extension) y SME (Scalable Matrix Extension), que aceleran operaciones vectoriales y matriciales usadas tanto en entrenamiento de IA como en computación científica, con soporte para FP64, FP32, BF16, FP16 e INT8.

El chip tiene una arquitectura de memoria poco habitual: combina 32 GB de HBM on-package (con ancho de banda de hasta 4 TB/s) con hasta 256 GB de memoria externa DDR5, maximizando bandwidth y capacidad al mismo tiempo.

Pese a esta dotación, el procesador solo gana un 3,6x de rendimiento al pasar de FP64 a precisión mixta, una cifra modesta frente a sistemas con aceleradores dedicados como AMD Instinct MI300A o Intel Ponte Vecchio. Un CPU Armv9 con SVE/SME puede acelerar cargas FP16/BF16/INT8, pero el uplift de precisión mixta queda limitado por ancho de banda de memoria, madurez del software y eficiencia del interconnect.

¿Qué dice sobre la independencia tecnológica china?

El hecho de que un supercomputador chino haya alcanzado un rendimiento FP64 tan elevado es notable por sí mismo. Aún más relevante: el NSCS efectivamente sometió sus resultados al Top500, lo que indica que la organización está confiada en que LineShine se apoya exclusivamente en tecnologías domésticas y en que el gobierno estadounidense no puede afectar la producción de estos componentes.

Es un dato de geopolítica industrial concreta: a pesar de los export controls de chips de alta gama y de equipos de litografía EUV, China entregó un sistema completo (procesador, interconnect y deployment) que ocupa el primer lugar del ranking mundial de supercómputo de doble precisión.