IA de código local: rode o Claude Code sem pagar API

Lorena AI News

08 de junho de 2026

Notícia IA · luiscortex

Resposta rápida

Sim, dá para usar IA de código local: aponte o Claude Code para o Ollama pela variável ANTHROPIC_BASE_URL. O código nunca sai da sua máquina e não há conta de API — modelos como Qwen 3.6 e Gemma 4 rodam em um computador com 24 GB de memória.

Em resumo

Dá para rodar o Claude Code com um modelo local via Ollama, sem pagar API à Anthropic. A variável ANTHROPIC_BASE_URL redireciona a ferramenta para o servidor local do Ollama. Qwen 3.6 e Gemma 4 rodam em um Mac Mini com 24 GB; o código nunca sai do computador. Para o seu negócio: corta custo e protege dados — mas a nuvem ainda vence em tarefas complexas.

Dá para usar o Claude Code sem pagar à Anthropic?

IA de código local é a resposta de quem ama o Claude Code, mas não quer uma conta de API imprevisível no fim do mês. A ideia, descrita pelo site MakeUseOf, é simples: em vez de mandar cada pedido para os servidores da Anthropic, você aponta a ferramenta para um modelo que roda no seu próprio computador. O Claude Code tem a variável de ambiente ANTHROPIC_BASE_URL, que redireciona as chamadas para outro endereço — no caso, uma instância do Ollama rodando na sua máquina.

O Ollama é um programa gratuito que executa modelos de pesos abertos localmente: você baixa, escolhe um modelo e ele sobe um servidor local com o qual outros aplicativos conversam como se fosse uma API remota. Sem API paga, sem assinatura e sem fatura de uso. Como tudo acontece offline, o seu código nunca sai do computador — um ponto decisivo para quem lida com NDA, dados de clientes ou informações sensíveis das áreas de saúde e jurídico.

Que máquina e quais modelos usar

No teste, o autor rodava o Ollama em um Mac Mini com 24 GB de memória unificada e integrava tudo ao terminal do VS Code. Dois modelos se destacaram para IA de código local: o Qwen 3.6, feito para programação agêntica, com bom desempenho em front-end e em raciocínio sobre repositórios inteiros (vem em versões de 27B e 35B, ocupando de 17 a 24 GB), e o Gemma 4, do Google DeepMind, um modelo que ativa só 4 bilhões de parâmetros por vez, além de uma versão densa de 31B para máquinas mais parrudas.

A conta vale a pena pela previsibilidade: nada de surpresa no boleto. Vale lembrar do outro lado — já houve relato de uma fatura de US$ 6 mil depois de alguém deixar o Claude Code rodando a noite toda na nuvem. Com IA de código local, esse risco simplesmente não existe.

Por que isso importa para o seu negócio

Para um estúdio pequeno, uma agência ou um desenvolvedor solo, IA de código local resolve dois problemas de uma vez: custo e privacidade. Você experimenta, automatiza e refatora sem o medo de estourar o orçamento, e mantém propriedade intelectual e dados de clientes dentro de casa.

A ressalva honesta: para o trabalho do dia a dia, um modelo local bem escolhido dá conta do recado, mas em refatorações que tocam vários arquivos, decisões de arquitetura e raciocínio mais complexo o Claude na nuvem ainda leva vantagem. A estratégia esperta é híbrida — usar o modelo local para o grosso do trabalho e recorrer ao modelo pago só quando a tarefa realmente exige. Comece instalando o Ollama, baixe um modelo e configure a variável de ambiente: em poucos minutos você tem um ambiente de IA de código local funcionando.

Conteúdo reescrito e traduzido para PT pela redação luiscortex, revisado por humano.

Fonte: MakeUseOf

Fonte: MakeUseOf · publicado originalmente em 23/05/2026

Conteúdo reescrito e traduzido para PT pela redação luiscortex, revisado por humano.

Perguntas frequentes

O que é IA de código local?

É rodar um modelo de IA para programação no seu próprio computador, em vez de usar a nuvem. Ferramentas como o Ollama executam modelos de pesos abertos sem API paga e sem mandar seu código para fora.

Como apontar o Claude Code para um modelo local?

O Claude Code lê a variável de ambiente ANTHROPIC_BASE_URL. Basta apontá-la para o servidor local do Ollama para que a ferramenta use o modelo da sua máquina.

Que computador é preciso para rodar IA de código local?

No teste, um Mac Mini com 24 GB de memória unificada rodou Qwen 3.6 e Gemma 4. Modelos maiores pedem mais memória; os de 27B ocupam de 17 a 24 GB.

O modelo local substitui o Claude da nuvem?

Para o dia a dia, sim. Mas em refatorações que tocam muitos arquivos e decisões de arquitetura, o Claude na nuvem ainda entrega resultado melhor. O ideal é usar os dois.

Escrito por Lorena AI News

Editora de notícias de IA. Cobertura diária do que importa para quem opera.