Dá para usar o Claude Code sem pagar à Anthropic?
IA de código local é a resposta de quem ama o Claude Code, mas não quer uma conta de API imprevisível no fim do mês. A ideia, descrita pelo site MakeUseOf, é simples: em vez de mandar cada pedido para os servidores da Anthropic, você aponta a ferramenta para um modelo que roda no seu próprio computador. O Claude Code tem a variável de ambiente ANTHROPIC_BASE_URL, que redireciona as chamadas para outro endereço — no caso, uma instância do Ollama rodando na sua máquina.
O Ollama é um programa gratuito que executa modelos de pesos abertos localmente: você baixa, escolhe um modelo e ele sobe um servidor local com o qual outros aplicativos conversam como se fosse uma API remota. Sem API paga, sem assinatura e sem fatura de uso. Como tudo acontece offline, o seu código nunca sai do computador — um ponto decisivo para quem lida com NDA, dados de clientes ou informações sensíveis das áreas de saúde e jurídico.
Que máquina e quais modelos usar
No teste, o autor rodava o Ollama em um Mac Mini com 24 GB de memória unificada e integrava tudo ao terminal do VS Code. Dois modelos se destacaram para IA de código local: o Qwen 3.6, feito para programação agêntica, com bom desempenho em front-end e em raciocínio sobre repositórios inteiros (vem em versões de 27B e 35B, ocupando de 17 a 24 GB), e o Gemma 4, do Google DeepMind, um modelo que ativa só 4 bilhões de parâmetros por vez, além de uma versão densa de 31B para máquinas mais parrudas.
A conta vale a pena pela previsibilidade: nada de surpresa no boleto. Vale lembrar do outro lado — já houve relato de uma fatura de US$ 6 mil depois de alguém deixar o Claude Code rodando a noite toda na nuvem. Com IA de código local, esse risco simplesmente não existe.
Por que isso importa para o seu negócio
Para um estúdio pequeno, uma agência ou um desenvolvedor solo, IA de código local resolve dois problemas de uma vez: custo e privacidade. Você experimenta, automatiza e refatora sem o medo de estourar o orçamento, e mantém propriedade intelectual e dados de clientes dentro de casa.
A ressalva honesta: para o trabalho do dia a dia, um modelo local bem escolhido dá conta do recado, mas em refatorações que tocam vários arquivos, decisões de arquitetura e raciocínio mais complexo o Claude na nuvem ainda leva vantagem. A estratégia esperta é híbrida — usar o modelo local para o grosso do trabalho e recorrer ao modelo pago só quando a tarefa realmente exige. Comece instalando o Ollama, baixe um modelo e configure a variável de ambiente: em poucos minutos você tem um ambiente de IA de código local funcionando.
Conteúdo reescrito e traduzido para PT pela redação luiscortex, revisado por humano.
Fonte: MakeUseOf




