Como correr Claude Code localmente gratis con Docker

Una guia paso a paso para apuntar Claude Code a un modelo local servido por Docker Model Runner. Cero tokens cloud, util para codigo propietario o trabajo offline.

Publicado el 12 de mayo de 2026 · 08:18 p. m.3 min de lectura

Al grano

Claude Code acepta la variable ANTHROPIC_BASE_URL para apuntar a un endpoint local en vez del cloud de Anthropic.

Docker Model Runner expone una API compatible en el puerto 12434, ejecutando modelos como ai/phi4:14B-Q4_K_M o ai/devstral-small-2.

El comando clave es: ANTHROPIC_BASE_URL=http://localhost:12434 claude --model ai/phi4:14B-Q4_K_M.

Por qué importa

El truco se apoya en que Claude Code respeta ANTHROPIC_BASE_URL y acepta cualquier endpoint que hable el protocolo de mensajes. La trampa: un phi4 de 14B-Q4 no es Claude Sonnet 4.6, la diferencia se nota en tareas largas. Pero para iterar prompts sin quemar plata o trabajar codigo bajo NDA, el setup tiene sentido. En Chile, donde la latencia al endpoint de Anthropic suma cientos de ms, correr local en una RTX 4070 puede ser mas snappy.

Sabemos que Claude Code es fenomenal para desarrollo y programacion. Pero podemos quedarnos sin tokens con facilidad, y la cuenta se vuelve cara rapidamente a medida que el proyecto se complejiza. ¿Que pasaria si pudieramos quedarnos con todo lo bueno de Claude Code, pero usando modelos locales en vez del cloud de Anthropic?

Otra razon para querer modelos locales es tener algo propietario o privado que no queremos exponer a los modelos cloud, o trabajar en un vuelo sin conexion a internet.

Aqui es donde Docker Model Runner es realmente util: nos permite correr LLMs muy facil de forma local en nuestra maquina, y despues hacemos un poco de configuracion para que funcione con Claude Code.

¿Que necesitas antes de empezar?

Antes de comenzar, asegurate de tener:

Docker Desktop o Docker Engine instalado.
Docker Model Runner habilitado.
Claude Code instalado y listo.

Si estas en Docker Desktop, anda a Settings > AI y habilita el acceso TCP para Model Runner.

O, si preferis la terminal:

Código

docker desktop enable model-runner --tcp 12434

Paso 1: Elegir y descargar un modelo local

Hay un monton de LLMs para elegir. En este ejemplo se va con ai/phi4:14B-Q4_K_M, pero podes elegir el que mejor le caiga a tu maquina. Podes encontrar todos los modelos en el catalogo de Docker Hub AI. Asegurate de que el modelo que elijas sea bueno en el lado de codigo.

Para descargar el modelo, ejecuta el comando:

Código

docker model pull ai/phi4:14B-Q4_K_M

El tiempo de descarga depende del tamano del modelo.

Paso 2: Chequear la conexion

Con los subcomandos docker model podemos chequear varias cosas: estado del runner y modelos que tenemos descargados. Es muy similar a como trabajamos con imagenes y contenedores Docker.

Código

docker model status
docker model ls

Paso 3: Probar el endpoint

Antes de saltar a Claude Code, conviene confirmar que la API esta respondiendo. Podemos usar curl contra el endpoint /v1/messages:

Código

curl http://localhost:12434/v1/messages \
  -H "Content-Type: application/json" \
  -d '{
    "model": "ai/phi4:14B-Q4_K_M",
    "max_tokens": 100,
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

La respuesta del modelo confirma que el endpoint local esta arriba. Para mejor formato de salida se sugiere usar jq.

Paso 4: Apuntar Claude Code al endpoint local

Es muy simple. Solo necesitamos decirle a Claude Code que use la API local en vez de la de Anthropic. Lo hacemos con una variable de entorno y el nombre del modelo.

Setea la variable de entorno ANTHROPIC_BASE_URL apuntando al endpoint de Docker Model Runner, y pasa el nombre del modelo con --model:

Código

ANTHROPIC_BASE_URL=http://localhost:12434 claude --model ai/devstral-small-2

Listo. Claude Code esta ahora apuntando y corriendo contra tu modelo local. Tambien vas a ver el modelo en uso desde la propia interfaz de Claude Code.

Paso 5: Hacerlo persistente con shell config

Como sabemos, la variable de entorno ANTHROPIC_BASE_URL no es persistente y solo vive durante la sesion actual de terminal. Setearla cada vez es molesto. Para hacerla permanente, agregamos la siguiente linea a la config del shell (~/.zshrc, ~/.bashrc, etc.):

Código

export ANTHROPIC_BASE_URL=http://localhost:12434

Despues de eso, reinicia la terminal y Claude Code usara siempre el endpoint local cuando le pases --model.

Paso 6: Usar Claude Code y ver el flujo

Para correr con el modelo local pasamos la misma flag de modelo:

Código

claude --model ai/phi4:14B-Q4_K_M

Si querias mirar bajo el capot, podes ver cada request que Claude Code envia al modelo local con:

Código

docker model requests --model ai/phi4:14B-Q4_K_M

Nuevamente, jq ayuda al formato.

¿Y si necesito mas contexto?

El tamano de contexto por defecto en la mayoria de los modelos esta bien para tareas chicas, pero Claude Code lee muchos archivos. Para trabajo en proyectos grandes vas a querer mas headroom y un contexto mayor.

Por ejemplo, para empaquetar gpt-oss con una ventana de 32K tokens:

Código

docker model pull ai/gpt-oss
docker model package --from ai/gpt-oss --context-size 32000 gpt-oss:32k

Luego corres Claude Code con la nueva variante:

Código

claude --model gpt-oss:32k

Y este es el juego: seguir probando y experimentando con distintos modelos y tamanos de contexto hasta encontrar el ideal para cada tarea.

Como correr Claude Code localmente gratis con Docker

Al grano

Por qué importa

¿Que necesitas antes de empezar?

Paso 1: Elegir y descargar un modelo local

Paso 2: Chequear la conexion

Paso 3: Probar el endpoint

Paso 4: Apuntar Claude Code al endpoint local

Paso 5: Hacerlo persistente con shell config

Paso 6: Usar Claude Code y ver el flujo

¿Y si necesito mas contexto?

Seguir leyendo

Claude Code rinde más al pedirle HTML en vez de Markdown

Anthropic reconoce tres errores en Claude Code y refuerza sus controles

Codex y Claude expanden los agentes IA fuera del código

Claude Opus 4.7: Salto en programación y freno en ciberseguridad

→Al grano

✦Por qué importa

¿Que necesitas antes de empezar?

Paso 1: Elegir y descargar un modelo local

Paso 2: Chequear la conexion

Paso 3: Probar el endpoint

Paso 4: Apuntar Claude Code al endpoint local

Paso 5: Hacerlo persistente con shell config

Paso 6: Usar Claude Code y ver el flujo

¿Y si necesito mas contexto?

Seguir leyendo

Claude Code rinde más al pedirle HTML en vez de Markdown

Anthropic reconoce tres errores en Claude Code y refuerza sus controles

Codex y Claude expanden los agentes IA fuera del código

Claude Opus 4.7: Salto en programación y freno en ciberseguridad

Al grano

Por qué importa