NVIDIA presentó esta semana en la conferencia ISC en Hamburgo nuevo software que acelera la inteligencia artificial aplicada a la ciencia, desde el descubrimiento de materiales hasta la búsqueda de materia oscura.
La biblioteca NVIDIA DAQIRI y los nuevos microservicios NVIDIA ALCHEMI NIM, sumados al código de referencia NVIDIA cuPhoton (próximo a liberarse), transforman trabajos que antes tomaban horas o días en CPU en pipelines en tiempo real acelerados por GPU.
Todos forman parte de NVIDIA CUDA-X, una colección de herramientas y bibliotecas con rendimiento dramáticamente superior en aplicaciones que incluyen IA y computación de alto rendimiento.
Investigadores de distintas disciplinas usan IA y computación acelerada para generar datos y conclusiones desde instrumentos y observatorios a mayor velocidad que nunca. Sobre sistemas NVIDIA GB200 NVL72, cuPhoton acelera la carga, lectura, procesamiento y análisis de datos en formato FITS, el estándar de archivos astronómicos usado por observatorios y telescopios. En early access, cuPhoton aceleró 14.900 veces la carga y lectura de imágenes FITS recolectadas por el Legacy Survey of Space and Time (LSST) del Rubin Observatory. También permitió análisis y procesamiento de señal hasta 8.400 veces más rápido usando 32 superchips NVIDIA Grace Blackwell.
En la práctica esto significa conclusiones más rápidas desde la cámara LSST, la cámara digital más grande jamás construida, que captura miles de millones de galaxias lejanas y también objetos cercanos y débiles que reflejan poca luz.
¿Qué hace cada biblioteca nueva de NVIDIA?
El software acelera investigación en materia oscura, simulación de materiales y más.
NVIDIA cuPhoton es un código de referencia para científicos que buscan extraer conclusiones de datos multidimensionales recolectados desde telescopios, rayos X y experimentos con láser. Está construido para cargar, procesar, analizar y visualizar petabytes de datos, y puede usarse junto a otras tecnologías NVIDIA CUDA-X para armar pipelines acelerados de punta a punta en astrofísica y astronomía.
Investigadores de Princeton University colaboraron con NVIDIA en el desarrollo de cuPhoton y lo usarán, junto con Harvard University, para procesar y analizar volúmenes masivos de datos recolectados por observatorios y surveys de energía oscura.
NVIDIA DAQIRI, acrónimo de Data Acquisition for Integrated Real-time Instruments, es una biblioteca de red de alto rendimiento que transmite datos desde detectores y sensores rápidos hacia el software NVIDIA. Los sistemas antiguos están atados a hardware fijo y pueden perder datos cuando los instrumentos generan información más rápido que la velocidad de escritura. DAQIRI los maneja a medida que llegan.
Un proyecto llamado A-GHOST fue desarrollado por científicos del CERN, la Universidad de Chicago y University College London, en el marco de CERNopenlab. Usa DAQIRI para correr IA en tiempo real sobre datos de colisiones registrados por el experimento ATLAS del CERN. A-GHOST analiza información que normalmente sería descartada por ATLAS (más del 99% del total por restricciones de almacenamiento), lo que le permite capturar señales potencialmente interesantes que de otra forma se perderían.
NVIDIA ALCHEMI reúne una colección de microservicios de dominio específico y un toolkit para acelerar el descubrimiento químico y de materiales, con aplicaciones que abarcan baterías, catalizadores, displays OLED, productos cosméticos y más.
En marzo NVIDIA liberó dos microservicios ALCHEMI NIM para relajación geométrica por lotes (BGR) y dinámica molecular por lotes (BMD). Estas herramientas aceleradas por IA permiten simular millones de moléculas y materiales en paralelo: BGR para encontrar sus estructuras más estables, BMD para simular cómo se mueven en el tiempo.
Además, se espera que ALCHEMI incluya pronto un microservicio para el ampliamente usado Vienna Ab initio Simulation Package (VASP), permitiendo correr simulaciones de materiales con mayor throughput de GPU. Al ejecutar múltiples cálculos VASP en una sola GPU con el NVIDIA Multi-Process Service, el microservicio logra 3 veces más velocidad en la optimización geométrica, el proceso de encontrar la disposición atómica más estable de un material.
Desarrolladores e investigadores también pueden usar el ALCHEMI Toolkit para acelerar el entrenamiento de modelos sustitutos llamados machine learning interatomic potentials y construir flujos de simulación atomística personalizados de alto rendimiento.
¿Cómo usa Lila Sciences a ALCHEMI para correr el método científico sin parar?

Lila Sciences, que construye una plataforma de superinteligencia científica y un laboratorio autónomo para ciencias de la vida, química y materiales, colaboró con NVIDIA en una simulación de alta fidelidad de imanes usando ALCHEMI, mostrada en NVIDIA GTC San Jose en marzo.
La empresa aceleró 50 veces el screening de materiales de alto rendimiento con el microservicio ALCHEMI NIM para BGR, identificando candidatos estables con mayor probabilidad de ser sintetizados. Luego aceleró el cálculo de propiedades magnéticas un 30% para los candidatos preseleccionados usando el microservicio ALCHEMI VASP en early access.

Las aceleraciones se acumulan. Los kernels especializados de ALCHEMI para TensorNet le dieron a Lila 6 veces más rápido en entrenamiento e inferencia, además de reducir el uso de memoria 3 veces, habilitando simulaciones que antes tomaban semanas en solo días.
En vez de correr un experimento a la vez, el enfoque evalúa múltiples materiales simultáneamente en memoria de GPU y puede generalizarse a casos de uso como:
- Descubrimiento de materiales: barrido de composiciones novedosas y estables a escala.
- Energía: catalizadores activos basados en elementos abundantes en la corteza terrestre para producir químicos y combustibles.
- Electromagnetismo: comprensión y predicción de comportamientos magnéticos complejos.
ALCHEMI se ubica en la capa de simulación, generando los datos de ciencia física que alimentan el resto del loop experimental.
Lila Sciences también recurre al stack completo de NVIDIA: NVIDIA Megatron-LM y NVIDIA Nemotron para entrenamiento (incluidos los modelos abiertos Nemotron 3 Nano y Nemotron 3 Super), las bibliotecas NeMo RL y NeMo Gym, NVIDIA BioNeMo para generación molecular, NVIDIA Triton y microservicios NIM para inferencia, y bibliotecas NVIDIA Omniverse para digital twins.
"El trabajo demuestra el uso de una pila de cómputo poderosa, ensamblada para acelerar el descubrimiento a una escala que ningún científico individual podría alcanzar solo", dijo Andy Beam, cofundador y director de tecnología de Lila Sciences.
¿Cuándo estará disponible cada componente?
El ALCHEMI Toolkit y Toolkit-Ops ya están disponibles para descarga desde GitHub y PyPI. Los microservicios ALCHEMI NIM se descargan desde el catálogo NVIDIA NGC. El microservicio ALCHEMI NIM para VASP se espera para este verano boreal.
DAQIRI ya está disponible en GitHub. cuPhoton también se libera durante el verano boreal.




