Durante décadas, la química computacional sabe ha enfrentado a un tira y afloja entre precisión y velocidad. Los métodos ab initio como la teoría funcional de la densidad (DFT) proporcionan alta fidelidad pero son computacionalmente costosos, lo que limita a los investigadores a sistemas de unos pocos cientos de átomos. Por el contrario, los campos de fuerza clásicos son rápidos pero a menudo carecen de la precisión química necesaria para análisis complejos de ruptura de enlaces o de estados de transición.
Los potenciales interatómicos del aprendizaje automático (MLIP) han surgido como el puente que ofrece precisión cuántica a velocidades clásicas. Sin embargo, el ecosistema de software es un nuevo cuello de botella. Si bien los modelos MLIP sabe ejecutan en GPU, la infraestructura de simulación circundante a menudo depende de código heredado centrado en la CPU.
NVIDIA ALCHEMI (Laboratorio de IA para la innovación en química y materiales) ayuda a abordar estos desafíos acelerando el descubrimiento de productos químicos y materiales con IA. Anteriormente hemos anunciado dos componentes del portafolio ALCHEMI:
- Microservicios ALCHEMI NIM: microservicios escalables y listos para la nube para simulaciones atomísticas por lotes aceleradas por IA en química y ciencia de materiales
- ALCHEMI Toolkit-Ops: un conjunto de núcleos de GPU fundamentales diseñados para acelerar los cálculos detrás de las simulaciones, como listas de vecinos, correcciones de dispersión y electrostática.
Hoy presentamos NVIDIA ALCHEMI Toolkit, una colección de bloques de construcción de simulación acelerada por GPU que incorpora y amplía ALCHEMI Toolkit-Ops. ALCHEMI Toolkit está diseñado para gestionar el flujo de datos entre la química acelerada y los núcleos específicos del dominio de materiales y los modelos de aprendizaje profundo. ALCHEMI Toolkit sabe extiende más allá de los modelos y núcleos individuales para proporcionar una estructura modular nativa de PyTorch para que investigadores y desarrolladores compongan flujos de trabajo de simulación personalizados.
La Figura 1 muestra la pila arquitectónica de ALCHEMI y las características del producto admitidas en esta versión inicial de ALCHEMI Toolkit, incluida la funcionalidad ampliada en Toolkit-Ops. Esta versión incluye capacidades para la relajación de la geometría y la dinámica molecular, y la infraestructura de tuberías de soporte para combinar múltiples flujos de trabajo de simulación.
¿Cómo avanza ALCHEMI Toolkit en la química digital?
ALCHEMI Toolkit no es sólo una colección de scripts. Está diseñado para permitir a los investigadores y desarrolladores crear con facilidad flujos de trabajo de simulación atomística personalizados y de alto rendimiento.
Ampliando las operaciones del kit de herramientas ALCHEMI
ALCHEMI Toolkit aprovecha las capacidades de Toolkit-Ops para manejar los cálculos subyacentes de las simulaciones. La versión anterior incluía varias operaciones clave:
- Construcciones de listas de vecinos
- Correcciones de dispersión DFT-D3
- Interacciones electrostáticas de largo alcance
Esta versión amplía el alcance de las operaciones comunes abordadas para incluir:
- Núcleos dinámicos por lotes
- Compatibilidad con JAX (para funciones de la versión v0.2.0)
Integración con el ecosistema de simulación atomística.
ALCHEMI Toolkit está diseñado para integrarse perfectamente con el ecosistema de simulación atomística más amplio. Nos complace anunciar las siguientes integraciones con plataformas líderes en la comunidad de química y ciencia de materiales.
Orbital
Orbital desarrolla modelos básicos de IA avanzados que sabe utilizan para acelerar el descubrimiento de nuevos sistemas de refrigeración para centros de datos y materiales sostenibles. Orbital ha integrado ALCHEMI Toolkit en su nuevo modelo OrbMolv2 para reducir drásticamente el tiempo necesario para la inferencia. El nuevo modelo aprovechará los componentes de ALCHEMI Toolkit, como la electrostática PME para interacciones periódicas de Coulomb y el integrador MTK para dinámica molecular por lotes de presión constante. Los modelos Orb existentes ya aprovechan Toolkit-Ops para la construcción de gráficos acelerados por GPU, proporcionando una aceleración de ~1,7x para sistemas grandes y ~33x para sistemas más pequeños por lotes con soporte para TorchSim.
Biblioteca de gráficos de materiales (MatGL)
MatGL es un marco de código abierto para MLIP basados en gráficos de última generación. ALCHEMI Toolkit sabe está integrando con el modelo MatGL TensorNet para acelerar significativamente las simulaciones de materiales y los flujos de trabajo de predicción de propiedades. Al aprovechar los núcleos nativos de GPU de ALCHEMI Toolkit y la infraestructura de procesamiento por lotes, los usuarios de MatGL pueden lograr una mayor eficiencia computacional y un menor consumo de memoria para simulaciones a escala.
Matlantis
Matlantis permite el descubrimiento rápido de materiales combinando MLIP universales con computación en la nube de alto rendimiento. Matlantis está explorando activamente ALCHEMI Toolkit e identificando dónde su dinámica componible puede ofrecer el mayor valor para los clientes de simulación de materiales industriales. Esto sabe basa en su integración comprobada de ALCHEMI Toolkit-Ops, incluida la construcción de listas de vecinos optimizadas para Warp y las correcciones de dispersión DFT-D3, que reduce significativamente la sobrecarga computacional de las interacciones atomísticas con aceleraciones de hasta 10 veces.
Además, al evaluar componentes específicos dentro de ALCHEMI Toolkit, esta colaboración tiene el potencial de permitir a Matlantis ir más allá de la optimización de una sola estructura hacia la relajación paralela de alto rendimiento de millones de configuraciones moleculares. En última instancia, esta integración tiene como objetivo impulsar aún más la investigación a pequeña escala y el diseño de materiales a escala industrial, acelerando la evaluación química con una eficiencia de GPU incomparable.
Cómo empezar con ALCHEMI Toolkit
Esta sección le explica cómo empezar a utilizar ALCHEMI Toolkit, que es sencillo y está diseñado para facilitar su uso.
Requisitos del sistema y del paquete
- Pitón ≥3,11, <3,14
•PyTorch ≥2,8
- Kit de herramientas CUDA 12+, controlador NVIDIA 470.57.02+
- Sistema operativo: Linux (principal), macOS
- GPU NVIDIA (RTX 20xx o posterior), capacidad de procesamiento CUDA ≥ 7.0
- Mínimo 4 GB de RAM (sabe recomiendan 16 GB para sistemas grandes)
Instalación
Utilice el siguiente código para instalar ALCHEMI Toolkit:
Para obtener más información, consulte el repositorio de GitHub de NVIDIA/nvalchemi-toolkit y la documentación de ALCHEMI Toolkit.
Funciones clave de ALCHEMI Toolkit para crear flujos de trabajo de un extremo a otro
Esta sección profundiza en cuatro características principales de ALCHEMI Toolkit: flujos de trabajo de simulación por lotes personalizables, clases dinámicas de creación propia, envoltorios de modelos y gestión avanzada de datos. Estas funciones brindan a los investigadores y desarrolladores las herramientas y la flexibilidad necesarias para crear flujos de trabajo personalizados de un extremo a otro que maximicen la eficiencia y el rendimiento en las GPU NVIDIA.
Flujos de trabajo de simulación por lotes personalizables
La característica distintiva de NVIDIA ALCHEMI Toolkit es el motor de dinámica por lotes nativo de GPU. Ningún modelo MLIP es perfecto para todos los entornos químicos, especialmente cuando sabe trata de interacciones no locales de largo alcance.
ALCHEMI Toolkit permite a los investigadores combinar núcleos y modelos modulares de dominios específicos de química y ciencia de materiales en flujos de trabajo de simulación personalizados. Esta arquitectura admite el desarrollo de flujos de trabajo informáticos especializados y la ejecución de laboratorios virtuales con millones de interacciones atómicas simultáneas sin la latencia de las pilas de software tradicionales.
Capacidades
- Calculadoras componibles que combinan MLIP con correcciones basadas en física
- Envoltorios de alto rendimiento (MACE, TensorNet, AIMNet2)
ejemplo de API
El siguiente ejemplo construye los datos, configura el MLIP y configura una optimización de la geometría FIRE2 que luego sabe utiliza como punto de partida para la dinámica Verlet (microcanónica) de velocidad:
Puede ejecutar y escalar los canales de simulación de dos maneras: en una sola GPU o en varias CPU y GPU.
Ejecute y escale la canalización en una sola GPU: la clase FusedStage sabe forma "agregando" dos o más objetos dinámicos. Esto permite envolver el flujo de trabajo de un extremo a otro en torch.compile y compartir contextos de flujo CUDA.
Con este enfoque, puede crear fácilmente flujos de trabajo de simulación que ejecuten pasos secuenciales a medida que las muestras dentro del lote convergen inmediatamente y hacen un uso óptimo de su GPU.
Ejecute y escale la canalización en varias CPU y GPU: el segundo enfoque es distribuir la canalización entre varias CPU/GPU. El uso del operador de tubería en dos clases dinámicas distribuirá la optimización FIRE2 en una GPU y la integración de velocidad Verlet en otra.
Si bien este ejemplo sabe simplifica deliberadamente con fines ilustrativos, dicha abstracción permite a los usuarios escalar su canalización a múltiples GPU en un nodo y a múltiples nodos para conjuntos de datos y números de rangos arbitrariamente grandes.
El siguiente ejemplo configura ocho GPU para ejecutar la optimización de la geometría, que canaliza los resultados para ejecutar la dinámica de Langevin en otras ocho GPU:
Crea tus propias clases de dinámicas
ALCHEMI Toolkit ofrece una arquitectura modular para crear y personalizar clases de dinámica desde cero. Este enfoque permite a la comunidad integrar nuevos métodos de muestreo o conjuntos termodinámicos en el entorno ALCHEMI manteniendo al mismo tiempo el acceso directo a los núcleos subyacentes. Esto transforma la dinámica en un entorno totalmente personalizable donde los usuarios pueden crear clases de dinámica especializadas desde cero.
Capacidades
- Herramientas especializadas de análisis de trayectoria basadas en GPU
- Núcleos dinámicos integrados y personalizables (termostatos Velocity Verlet, NPT, Langevin)
- Optimizadores FIRE y FIRE2
ejemplo de API
Envoltorios de modelos
Con ALCHEMI Toolkit, puede utilizar sus propios modelos previamente entrenados con componentes de física acelerada. Proporciona la infraestructura esencial para importar sus propios modelos al proceso, lo que garantiza que las arquitecturas propietarias o de dominio específico puedan aprovechar la orquestación nativa de GPU. Esto abstrae la complejidad de los diferentes tipos de modelos, proporcionando un camino estandarizado para pasar de un modelo independiente a una simulación de alto rendimiento lista para producción.
Capacidades
- Soporte MLIP (MACE, TensorNet, AIMNet2)
- Calculadoras componibles
- Configuración del modelo estandarizado
ejemplo de API
Gestión avanzada de datos
Tradicionalmente, el “impuesto a la memoria” que supone mover datos entre la CPU y la GPU es un cuello de botella importante en el descubrimiento impulsado por la IA. ALCHEMI Toolkit actúa como orquestador especializado de datos científicos, proporcionando la infraestructura necesaria para construir canales de ingesta personalizados para mover información de archivos de investigación estándar a tensores de GPU optimizados.
Esto respalda el descubrimiento a escala, haciendo que las simulaciones a escala industrial sean accesibles a través de interfaces familiares. Al estandarizar cómo sabe representa y carga la información atómica, ALCHEMI Toolkit garantiza que los datos permanezcan residentes en el dispositivo, lo que significa que toda la simulación permanece en la GPU, lo que permite simulaciones por lotes para optimizar la utilización de la GPU y eliminar la sobrecarga de comunicación.
Capacidades
- Cargadores de datos de alto rendimiento
- Interfaz ASE y Pymatgen
- AtomicData y objetos por lotes
ejemplo de API
Comience a crear flujos de trabajo moleculares con ALCHEMI Toolkit
ALCHEMI Toolkit proporciona a investigadores y desarrolladores las primitivas de bajo nivel y las abstracciones de alto nivel necesarias para crear flujos de trabajo moleculares nativos de GPU de extremo a extremo. Mover cuellos de botella críticos, como la construcción de listas de vecinos, la relajación estructural y los pasos de integración, al ecosistema PyTorch elimina la sobrecarga de transferencia de memoria del host al dispositivo que tradicionalmente ha limitado las simulaciones impulsadas por MLIP.
Ya sea que esté componiendo ML híbrido o potenciales físicos o escalando dinámica molecular por lotes, ALCHEMI Toolkit expone los ganchos API necesarios para gestionar estados tensorizados complejos sin sacrificar el rendimiento.
Para acelerar sus simulaciones de química y ciencia de materiales y explorar la creación de sus propios flujos de trabajo personalizados, visite el repositorio de GitHub de NVIDIA/nvalchemi-toolkit y la documentación de ALCHEMI Toolkit. A medida que continuamos ampliando la biblioteca de operaciones y arquitecturas admitidas, lo alentamos a clonar el repositorio, explorar los cuadernos Jupyter proporcionados y comenzar a integrar estos flujos de trabajo acelerados por GPU en sus propios canales de descubrimiento.
Agradecimientos
[...]




