Seis años después de la presentación provisional de OpenCL 3.0, The Khronos Group anunció hoy OpenCL 3.1, una revisión que sube al núcleo del estándar varias capacidades que hasta ahora vivían como extensiones opcionales. La intención declarada es alinear el ecosistema con las necesidades reales de las cargas de IA y HPC en 2026.

¿Qué cambia exactamente en OpenCL 3.1?

Entre las nuevas obligaciones del core destaca el soporte de ingestión de SPIR-V, lo que permite ejecutar kernels SPIR-V de forma nativa. Es una representación intermedia compartida con Vulkan y se puede generar desde toolchains como LLVM/Clang, lo que simplifica el desarrollo cruzado entre APIs de cómputo y gráficos.

El paquete específico para IA y HPC incluye:

  • Subgrupos (subgroups), patrón fundamental para reducir sincronización en GPUs modernas
  • Operaciones de producto punto entero (integer dot products), claves para inferencia cuantizada
  • Una nueva consulta del tamaño sugerido de work-group local para que el runtime entregue defaults razonables al desarrollador
  • UUID estándar de dispositivo, alineado con la convención que ya usaba Vulkan

OpenCL 3.1 también suma mejoras de lenguaje sin necesidad de extensiones, mejor soporte de printf() en OpenCL C, y relaja los inclusive scopes del modelo de memoria.

Logotipo de OpenCL 3.1 publicado por Khronos
Logotipo de OpenCL 3.1 publicado por Khronos

¿Quién lo soporta el día uno?

Varios proveedores ya tienen trabajo en curso. El driver Mesa y Rusticl anunciaron compatibilidad inicial el mismo día del release, junto con PoCL y CLVK, todas implementaciones de código abierto. La cobertura abarca GPUs Radeon, Intel Iris y la capa Zink/Vulkan.

¿Qué viene después?

Khronos también adelantó las extensiones que llegarán en próximos meses, todas con foco explícito en IA y HPC:

  • Command buffers para cargas reproducibles con bajo overhead
  • Mejoras a memoria compartida unificada (USM)
  • Operaciones de matrices cooperativas (cooperative matrix), análogo a las tensor cores
  • Nuevos tipos de datos para IA en formatos de baja precisión

¿Por qué importa para el ecosistema chileno y LATAM?

OpenCL es la única API de cómputo paralelo abierta y multi-vendor que sigue evolucionando con seriedad: corre sobre GPUs AMD, Intel, NVIDIA, ARM Mali, y aceleradores como los DSPs de Qualcomm. Para laboratorios universitarios o startups regionales que no quieren atarse a CUDA, el camino abierto pasa por OpenCL o ROCm. Equipos de investigación en universidades chilenas que trabajan con clusters heterogéneos podrán correr workloads de IA de baja precisión sobre hardware AMD o Intel sin reescribir kernels para una API privativa.

Más detalles del cambio están en el anuncio oficial en Khronos.org y la documentación completa de OpenCL 3.1 vive en GitHub.

Update: Phoronix también reportó que el driver Rusticl ya tiene OpenCL 3.1 funcionando sobre Radeon, Intel Iris y Zink/Vulkan el mismo día del release.