NVIDIA BioNeMo duplica la eficiencia de los agentes científicos

El Agent Toolkit empaqueta OpenFold3, DiffDock, GenMol, Evo 2 y Parabricks como herramientas callable por agentes vía Model Context Protocol, sobre NIM hosted o local.

Publicado el 24 de junio de 2026 · 01:27 a. m.3 min de lectura

Al grano

NVIDIA BioNeMo Skills exponen OpenFold3, DiffDock, GenMol, Evo 2, MMseqs2 y otros modelos biomoleculares como herramientas para agentes.

El benchmark con Codex CLI y GPT-5.5 fast subió la tasa de completion del 57,1% al 100% y duplicó la eficiencia por token.

Las Skills se publican vía wrappers MCP o NIM endpoints (hosted en build.nvidia.com o locales en GPU del usuario).

Por qué importa

El benchmark 57,1% a 100% suena espectacular, pero conviene leerlo con cuidado: es la propia NVIDIA midiendo su propio toolkit con un agente afín. Lo interesante no es el número sino el patrón: documentar cada modelo como Skill con contrato explícito (inputs, outputs, errores) es la única forma de que los agentes sean confiables más allá del demo. Si esto se vuelve estándar (MCP empuja en esa dirección), bajará la barrera para que biólogos sin background ML hagan ciencia computacional seria.

Los AI scientists están emergiendo como nueva interfaz para la computación científica. Estos agentes leen papers, escriben código, generan hipótesis, llaman APIs, inspeccionan archivos y iteran sobre los resultados. Pero la ciencia no es ingeniería de software: no hay suite de tests que se ponga verde cuando una hipótesis es correcta. El descubrimiento es iterativo, incierto y anclado al mundo físico.

NVIDIA acaba de empaquetar su stack acelerado de biología digital en un toolkit pensado para agentes: BioNeMo Agent Toolkit, una capa de Skills que documenta propósito, inputs requeridos, parámetros opcionales, artifacts esperados y modos de falla de cada modelo biomolecular. La idea: que un agente como Claude o Codex elija el modelo correcto, prepare un request válido y lea el resultado sin que un humano lo guíe paso a paso.

¿Qué incluye el BioNeMo Agent Toolkit?

Las Skills son wrappers documentados sobre modelos publicados como NIM (NVIDIA Inference Microservices) o sobre modelos open que aún no fueron empaquetados como NIM (en ese caso vía servidores MCP, Model Context Protocol). El catálogo inicial cubre las tareas centrales de descubrimiento biomolecular:

Plegamiento de proteínas: OpenFold3 y Boltz-2
Docking molecular: DiffDock
Generación de moléculas: GenMol
Diseño de secuencias: ProteinMPNN, RFdiffusion
Búsqueda y alineamiento: MMseqs2 (vía MSA Search)
Genómica: Evo 2 y la suite Parabricks
Aceleración: bibliotecas cuEquivariance (estructura) y Parabricks (genómica)

El repositorio público vive en github.com/NVIDIA-BioNeMo/bionemo-agent-toolkit y los endpoints hosted están en build.nvidia.com.

¿Cuánto mejora un agente con BioNeMo Skills?

NVIDIA midió la diferencia con un benchmark interno usando Codex CLI y GPT-5.5 fast como agente. Sin skills, la tasa de completion sobre tareas biomoleculares quedó en 57,1%. Con skills, subió al 100%. La eficiencia de tokens (assertions pasadas por token consumido) se duplicó en promedio.

Métrica	Sin Skills	Con Skills
Task completion rate	57,1%	100%
Eficiencia por token	1× (baseline)	2× promedio
Iteraciones por tarea	mayor	menor

El salto se explica porque las Skills le evitan al agente "adivinar" cómo invocar cada modelo: cada wrapper trae el contrato de uso explícito.

¿Hosted o local? Cuándo conviene cada modo

NVIDIA ofrece dos rutas de deployment para las NIMs:

Hosted en build.nvidia.com: ideal para acceso rápido, evaluación o llamadas ocasionales. Sin gestión de GPU, sin contenedores que mantener. Recomendado para workflows que dependen de servicios infra-intensivos como MSA Search.
Local en GPU propia: pensado para loops iterativos que llaman al mismo modelo muchas veces. Reduce la latencia warm por llamada y permite mantener datos sensibles in-house.

La regla práctica que sugieren: empezar hosted para tener acceso amplio y escalable, luego mover modelos puntuales a local cuando latencia, throughput, seguridad o iteración repetida justifiquen el control operativo extra. Los endpoints públicos en build.nvidia.com son para development y testing, no para inferencia en producción.

Una skill en acción: OpenFold3

El patrón de prompt es el mismo para cualquier Skill. Para plegar la secuencia MKTVRQERLKSIVR contra un endpoint OpenFold3 hosted:

Código

Use the OpenFold3 BioNeMo Skill to fold MKTVRQERLKSIVR with the NVIDIA API
endpoint at https://build.nvidia.com/openfold3

Para deployment local:

Código

Use the OpenFold3 BioNeMo Skill to fold MKTVRQERLKSIVR with the local NIM
endpoint at http://localhost:8000

El agente recibe el contrato del modelo (qué hace, qué input necesita, qué artifact devuelve, qué errores puede tirar) y se encarga del resto.

¿Y qué pasa con investigadores en Chile y LatAm?

Para grupos de investigación universitarios chilenos (UC, USACH, UCN, Universidad de Concepción) y argentinos que vienen trabajando en biología computacional, el toolkit baja considerablemente la barrera de entrada. Acceder a OpenFold3 o DiffDock sin tener que pelearse con CUDA, contenedores Docker y dependencias Python rotas es una mejora real. Para quien no tenga GPU H100 a mano, los endpoints hosted en build.nvidia.com ofrecen un camino sin costo inicial (con créditos free) suficiente para prototipar antes de escalar.

NVIDIA también menciona que el patrón se extiende más allá de un solo tool: el broader stack incluye NVIDIA Nemotron (modelos abiertos) y el NeMo Agent Toolkit para orquestación y memoria, manteniendo el mismo enfoque de Skills documentadas para cada capacidad.

NVIDIA BioNeMo duplica la eficiencia de los agentes científicos

Al grano

Por qué importa

¿Qué incluye el BioNeMo Agent Toolkit?

¿Cuánto mejora un agente con BioNeMo Skills?

¿Hosted o local? Cuándo conviene cada modo

Una skill en acción: OpenFold3

¿Y qué pasa con investigadores en Chile y LatAm?

Seguir leyendo

NVIDIA XR AI: librería abierta para agentes en gafas AR

NVIDIA lanza Nemotron 3 Nano Omni, modelo omnimodal para agentes de IA

NVIDIA BioNeMo Recipes: LoRA entrena modelos biológicos en una sola GPU

NVIDIA verifica skills de agentes con firma criptográfica

→Al grano

✦Por qué importa

¿Qué incluye el BioNeMo Agent Toolkit?

¿Cuánto mejora un agente con BioNeMo Skills?

¿Hosted o local? Cuándo conviene cada modo

Una skill en acción: OpenFold3

¿Y qué pasa con investigadores en Chile y LatAm?

Seguir leyendo

NVIDIA XR AI: librería abierta para agentes en gafas AR

NVIDIA lanza Nemotron 3 Nano Omni, modelo omnimodal para agentes de IA

NVIDIA BioNeMo Recipes: LoRA entrena modelos biológicos en una sola GPU

NVIDIA verifica skills de agentes con firma criptográfica

Al grano

Por qué importa