Los agentes personales están viviendo una explosión de adopción, con proyectos open source como OpenClaw y Hermes registrando crecimiento acelerado en comunidades de desarrollo de IA en GitHub. Construidos para adaptarse a preferencias y flujos de trabajo individuales, estos agentes pueden interactuar con aplicaciones, generar contenido, automatizar procesos repetitivos y gestionar tareas multipaso, todo mientras corren localmente en el dispositivo.

Hoy, en NVIDIA GTC Taipei en COMPUTEX, NVIDIA presentó NVIDIA RTX Spark, una nueva clase de PCs Windows hechos a propósito para agentes personales, junto con una ola de actualizaciones que expanden los agentes locales a través de los ecosistemas NVIDIA RTX y DGX.

Correr agentes de forma segura y privada exige hardware a la altura. El 1 petaflop de cómputo de IA y los 128GB de memoria unificada de RTX Spark cubren la demanda de cómputo de los agentes on-device, ofreciendo una nueva clase de computador que pasa de herramienta a compañero de equipo. Diseñado para IA, creación y gaming, RTX Spark lleva 30 años de innovación de NVIDIA a laptops Windows delgadas con autonomía de día completo y desktops ultraeficientes.

La alianza de NVIDIA con Windows escala desde lo personal hasta soluciones empresariales. También se presentó en el show la NVIDIA DGX Station for Windows, el supercomputador deskside definitivo para profesionales, que trae GPU y CPU de clase data center para inferencia en un sistema de escritorio equipado con Windows para manejabilidad, seguridad y compatibilidad.

Otros anuncios incluyen:

  • El runtime NVIDIA OpenShell llega a Windows, construido sobre las nuevas primitivas de seguridad de Microsoft para agentes, entregando a los desarrolladores un paquete fácil de desplegar para agentes seguros on-device. Hermes Agent y OpenClaw también integrarán OpenShell y las primitivas de seguridad de Microsoft en sus nuevas aplicaciones Windows.
  • El blueprint NVIDIA NemoClaw se expande a través del lineup local de IA de NVIDIA: GeForce RTX, RTX PRO, RTX y DGX Spark, y DGX Station, con instaladores simplificados y soporte para Hermes Agent.
  • 2x rendimiento de inferencia sobre los modelos agénticos top con multi-token prediction en llama.cpp y vLLM, además de nuevas optimizaciones multi-GPU para llama.cpp y ComfyUI.
  • H Company libera herramientas de computer-use, incluyendo nuevos modelos y un futuro harness de agente de escritorio, optimizadas para PCs RTX y DGX.
  • Adobe está rearquitectando Photoshop y Premiere, Blender suma NVIDIA DLSS 4.5 Ray Reconstruction y NVIDIA presentó RTX Video Frame Generation, que llegará a ComfyUI. Todas estas actualizaciones aterrizan este otoño boreal junto con RTX Spark.
  • La actualización NVIDIA Broadcast 2.2 trae optimizaciones de Studio Voice y soporte para Elgato Stream Deck. NVIDIA Project G-Assist también suma integración con Stream Deck.

¿Qué hace distinto a RTX Spark para correr agentes?

La adopción amplia de agentes ha estado limitada por la imposibilidad de correrlos de forma segura y privada en los PCs principales de los usuarios.

NVIDIA y Microsoft se aliaron para resolver ese desafío entregando una plataforma Windows robusta y segura para agentes on-device.

La colaboración arranca con una base fuerte: nuevas primitivas de seguridad de Windows y el runtime NVIDIA OpenShell, para asegurar que los agentes corran de manera segura y bajo control total del usuario.

Las nuevas primitivas Windows entregan capacidades de identidad, contención, política y seguridad end-to-end para construir y correr agentes nativamente. NVIDIA OpenShell aporta capacidades adicionales de política para que el usuario defina qué pueden y qué no pueden hacer los agentes, la habilidad de enrutar inteligentemente queries a modelos locales según las políticas de privacidad del usuario, y la posibilidad de enmascarar información personal en queries enviadas a modelos en la nube.

Esta capa robusta de seguridad y privacidad está siendo adoptada por desarrolladores líderes de agentes como Hermes Agent y OpenClaw en sus nuevas apps Windows. Estas nuevas aplicaciones harán fácil y seguro que los usuarios accedan a agentes on-device potentes capaces de ejecutar tareas en aplicaciones Windows, razonar a través de flujos multi-app, generar imágenes y video, programar plug-ins y apps, y buscar semánticamente archivos locales.

Impulsar agentes en dispositivos locales requiere tanto seguridad robusta como hardware performante. RTX Spark ofrece hasta 1 petaflop de cómputo de IA y 128GB de memoria unificada para cubrir la demanda de procesamiento de los agentes on-device.

NVIDIA también está acelerando el ecosistema de modelos abiertos locales del que estos agentes dependen.

NVIDIA colaboró con la comunidad de llama.cpp para habilitar features y optimizaciones como multi-token prediction (MTP), una técnica de decoding especulativo en que un modelo borrador más pequeño propone múltiples tokens a la vez que el modelo objetivo verifica en un solo paso. Esto, junto con otras optimizaciones como programmatic dependent launch, entrega 2x rendimiento sobre Qwen 3.6 y 3.5 27B, y un boost de 1.6x sobre Qwen 3.6 y 3.5 35B. Estas actualizaciones están disponibles vía la webUI de llama.cpp y LM Studio.

Ganancias de rendimiento con las optimizaciones NVIDIA a llama.cpp: Qwen3.6-27B hasta 2x throughput y Qwen3.6-35B hasta 1.6x en GeForce RTX 5090
Ganancias de rendimiento con las optimizaciones NVIDIA a llama.cpp: Qwen3.6-27B hasta 2x throughput y Qwen3.6-35B hasta 1.6x en GeForce RTX 5090

Para entusiastas de IA con setups multi-GPU, NVIDIA colaboró con la comunidad open source para mejorar dos de las herramientas locales de IA más populares:

  • llama.cpp suma paralelismo tensorial para hasta 2x memoria y 1.8x cómputo en dos GPUs equivalentes.
  • ComfyUI gana un nuevo método de classifier-free guidance para hasta 2x rendimiento en dos GPUs equivalentes, más la opción de partir cadenas de modelos entre GPUs para aprovechar la memoria combinada.
Mejoras de generación de tokens con paralelismo tensorial multi-GPU vs pipeline paralelo y single-GPU en llama.cpp
Mejoras de generación de tokens con paralelismo tensorial multi-GPU vs pipeline paralelo y single-GPU en llama.cpp
Mejoras de tiempo de generación en técnicas multi-GPU sobre ComfyUI
Mejoras de tiempo de generación en técnicas multi-GPU sobre ComfyUI

NVIDIA también está expandiendo capacidades de agente con H Company. El harness de computer-use de H Company permite que los agentes naveguen un PC viendo la pantalla y operando mouse y teclado como un usuario, incluso en apps sin APIs, y llegará pronto a PCs RTX y DGX con soporte de modelos locales.

NVIDIA colaboró con H Company para cuantizar sus modelos Holo Computer Use de última generación, además de acelerar su harness, impulsando un speedup de 2x en GPUs NVIDIA mientras reduce el consumo de memoria en 35%. Los modelos están disponibles para descarga ahora, y la app Holo Desktop estará disponible pronto.

Optimizaciones de agente para Linux

Para desarrolladores que necesitan agentes locales siempre accesibles, NVIDIA DGX Spark es el computador personal de IA más capaz para quienes requieren entorno Linux, unificando memoria grande, cómputo rápido y compatibilidad con el ecosistema NVIDIA CUDA.

El release de DGX Spark OS de este mes trae la experiencia out-of-the-box más fluida con un instalador NemoClaw simplificado, junto con inferencia más rápida sobre los modelos agénticos top.

NemoClaw está ahora disponible para todos los PCs NVIDIA RTX y DGX sobre Linux y Windows Subsystem for Linux. Despliega de forma segura agentes locales sobre Linux con nuevos instaladores simplificados, entregando sandboxing automático y soporte agregado para Hermes Agent.

NVIDIA colaboró con vLLM para optimizar inferencia para agentes, con optimizaciones en vLLM y nuevos checkpoints NVFP4 optimizados para Qwen 3.6 35B. Las actualizaciones entregan 2.6x rendimiento en DGX Spark comparado con los checkpoints NVFP4 previamente disponibles desde Unsloth, e incluyen mejoras de kernel, precisión mixta y soporte CUDA Graph para MTP.

Lee el blog de vLLM para un walkthrough completo de servir modelos NVFP4 mixture-of-experts en DGX Spark, desde el tuning de memoria unificada hasta una configuración de referencia funcional con NVIDIA Nemotron 3 Super.

¿Qué cambia Adobe con RTX Spark?

NVIDIA se asocia con Adobe para rearquitectar Adobe Premiere y Photoshop para RTX Spark. Generative Fill en Photoshop y Generative Extend en Premiere, ambos impulsados por Firefly, están entre los cientos de herramientas aceleradas que entregan potencia creativa, precisión y control. RTX Spark lleva estas capacidades más allá, entregando hasta 2x más velocidad en IA, edición, color y efectos a lo largo de los flujos creativos.

Adobe Premiere estrenará un nuevo pipeline de video que aprovecha la memoria unificada de RTX Spark, GPU Blackwell y software TensorRT, entregando rendimiento en tiempo real para edición y corrección de color, rendimiento de IA acelerado por GPU y renderizado más eficiente de timelines complejas. Además, Substance 3D Painter y Stager de Adobe correrán nativamente en RTX Spark para flujos de texturizado y creación de escenas 3D más fluidos y reactivos.

El motor Photoshop de próxima generación estará optimizado para compositing acelerado por GPU, habilitando filtros en vivo, alto rango dinámico y pinceles naturales modernos. El pipeline AI-native está construido para aprovechar toda la potencia de RTX Spark, incluyendo TensorRT.

Adobe extenderá adicionalmente Premiere y Photoshop para permitir a los usuarios crear, editar y diseñar con agentes Windows, entregando a los creadores un compañero colaborativo que acelera sus flujos de trabajo.

Las actualizaciones de las apps creativas de Adobe (Premiere, Photoshop y Substance) deberían empezar a rolar junto con la disponibilidad de RTX Spark.

Nuevas herramientas y updates para creadores

Nuevas actualizaciones de plataforma NVIDIA y optimizaciones de apps de socios están saliendo a través del ecosistema RTX más amplio, algunas embarcando hoy y otras llegando con RTX Spark este otoño.

NVIDIA Broadcast 2.2 gradúa Studio Voice, una función de IA que hace que cualquier micrófono suene con calidad de estudio, fuera de beta a partir de hoy. Studio Voice ahora corre en GeForce RTX 3060 y superiores con rendimiento mejorado. La aplicación también obtiene integración con Elgato Stream Deck y atajos de teclado configurables.

Project G-Assist también suma soporte Stream Deck vía el servidor Elgato MCP, permitiendo a los usuarios habilitar capacidades de asistente de IA para su setup de streaming.

Además, Blender Cycles está integrando DLSS 4.5 Ray Reconstruction como un nuevo denoiser, transformando el viewport path-tracing en un visor interactivo en tiempo real. Esto permite a los artistas 3D navegar por una escena viendo calidad cercana al render final, transformando los flujos de iluminación y look development. La actualización se libera con Blender 5.3 este otoño, junto con RTX Spark.

También lanzando con RTX Spark, RTX Video Frame Generation es un nuevo efecto IA que duplica o cuadruplica la tasa de cuadros de video en tiempo real, ideal para realzar las salidas a 15-20 fps que los modelos de IA típicamente generan. Llega como una Python wheel y un nodo ComfyUI, permitiendo a los artistas IA generar videos más rápido a bajo fps y luego interpolar a tasas de reproducción suaves.