GPUs para IA local 2026: Jetson, Mac M-series, RTX 5090, alternativas

Correr modelos de IA localmente dejó de ser un nicho de hobbistas para volverse una opción legítima para developers, pequeñas empresas y privacidad-first. En 2026 la oferta se expandió: NVIDIA cementó su catálogo edge con Jetson Orin Nano Super y Thor (en pre-anuncio), Apple normalizó M4 Ultra con 192GB de memoria unificada para inferencia de LLMs grandes, y RTX 5090 (32GB GDDR7) bajó el ticket consumer para entrenamiento.

Lo que cubrimos en esta guía: el catálogo real de hardware viable para IA local en 2026, la pregunta práctica de cuánta VRAM necesita cada modelo (Llama 4, Claude Sonnet local, Qwen 3, DeepSeek), comparativa de tokens/segundo en plataformas distintas y el cálculo honesto de costo total para un dev en Chile (precio del hardware + envío + IVA + electricidad por hora de uso).

No es un universo solo NVIDIA: Apple Silicon es competitiva en memoria unificada, Tenstorrent ofrece ASICs interesantes y los players chinos empiezan a llegar a LATAM con precios disruptivos.

NVIDIA Jetson: el catálogo edge

Jetson Orin Nano Super (USD 249), Orin NX, AGX Orin, y los rumores de Thor. Cuál sirve para qué carga de IA edge, qué modelos corren en cada uno, comparativa con Raspberry Pi 5 + AI HAT.

Apple Silicon: Mac M-series para LLM local

Por qué un MacBook M4 Pro corre Llama 4 70B mejor que una RTX 4090 — la memoria unificada cambia el juego. Cobertura del M3/M4 Ultra, Mac Studio para inferencia y benchmarks reales en MLX.

RTX 5090 y consumer GPUs para IA

RTX 5090 con 32GB GDDR7 abrió la posibilidad de fine-tuning casero. Comparativa con RTX 4090, costo total Chile (precio + IVA + envío) y qué modelos corren a qué velocidad.

Alternativas: Tenstorrent, Cerebras, Groq

Más allá de NVIDIA. Tenstorrent Wormhole/Blackhole con licencia abierta, Cerebras CS-3 para entrenamiento masivo, Groq LPU para inferencia ultra-rápida. Cuándo conviene cada una.

Cuánta RAM/VRAM realmente necesitas

Tabla comparativa de modelos populares (Llama 4, Claude Sonnet local, Qwen 3, DeepSeek, Kimi K2) vs VRAM mínima por nivel de cuantización. Trade-offs precision/calidad/velocidad explicados.

Aún no hay notas publicadas en el portal sobre este subtema. Volvé pronto.

Seguir explorando

Sección IA Sección Electrónica

GPUs para IA local 2026: NVIDIA, Apple y alternativas

NVIDIA Jetson: el catálogo edge

NVIDIA y Google Cloud impulsan la IA agéntica y física

NVIDIA lanza Nemotron 3 Nano Omni, modelo omnimodal para agentes de IA

NVIDIA Nemotron 3 Nano Omni unifica video, audio e imagen en un modelo

Optimización de memoria para modelos grandes en NVIDIA Jetson

NVIDIA impulsa la manufactura con IA en Hannover Messe 2026

Apple Silicon: Mac M-series para LLM local

Espressif lanza ESP-Claw: agentes de IA local para ESP32

UGV Beast: Robot todoterreno con IA para Raspberry Pi 4 y 5

SamuRoid: Robot humanoide con Raspberry Pi 4, ROS y LLM multimodal

IA local: ejecuta LLMs privados en tu propio computador

Cámaras Firefly IP67 con SoCs Rockchip para IA industrial y automotriz

RTX 5090 y consumer GPUs para IA

NVIDIA y Google Cloud impulsan la IA agéntica y física

NVIDIA lanza Nemotron 3 Nano Omni, modelo omnimodal para agentes de IA

NVIDIA Nemotron 3 Nano Omni unifica video, audio e imagen en un modelo

NVIDIA impulsa la manufactura con IA en Hannover Messe 2026

Alternativas: Tenstorrent, Cerebras, Groq

PCB abierta convierte el Google Home Mini en asistente local sin nube

Nuevo HAT Zerowriter Pi: Pantallas ePaper a 12 FPS para Raspberry Pi

Move Ultralight: el wearable open source sin pantalla ni suscripciones

Monitor de aire solar con LoRa: el proyecto pollutagNode2

Cuánta RAM/VRAM realmente necesitas

Seguir explorando