Gemini 3.5 Flash: o novo padrão de IA da Google

Gemini 3.5 Flash: o modelo da Google que aposta em agentes, não chatbots

Lorena AI News

Interface do Gemini 3.5 Flash com múltiplos agentes de IA executando tarefas em paralelo no Google Antigravity

Resposta rápida

Gemini 3.5 Flash é o novo modelo de inteligência artificial da Google, lançado no I/O 2026 em maio de 2026. Ele opera 4 vezes mais rápido que modelos fronteira concorrentes, supera o Gemini 3.1 Pro em benchmarks de código e tarefas agentivas, e é precificado em US$ 1,50 por milhão de tokens de entrada. Empresas que processam alto volume de dados podem economizar mais de US$ 1 bilhão por ano migrando cargas de trabalho para ele.

Em resumo

Gemini 3.5 Flash foi lançado no Google I/O 2026 e supera o Gemini 3.1 Pro em quase todos os benchmarks É 4x mais rápido que modelos fronteira concorrentes — versão otimizada chega a 12x mais velocidade Custa US$ 1,50 por milhão de tokens de entrada e US$ 9 por milhão de tokens de saída Shopify, Salesforce, Ramp e Xero já o utilizam em produção para automação de agentes Torna-se o modelo padrão no app Gemini e no modo de busca com IA da Google

A Google apostou todas as fichas em agentes autônomos. No Google I/O 2026, realizado em 19 de maio, a empresa apresentou o Gemini 3.5 Flash — um modelo projetado não para responder perguntas, mas para executar tarefas complexas em paralelo, com mínima intervenção humana.

A mudança de posicionamento é deliberada: enquanto a maioria dos grandes modelos de linguagem ainda é associada a chatbots, o Gemini 3.5 Flash foi construído para ser o motor de agentes de IA que operam por horas, tomam decisões, usam ferramentas e coordenam subagentes em paralelo.

O que é o Gemini 3.5 Flash e o que ele entrega

Segundo Koray Kavukcuoglu, tecnologista-chefe do Google DeepMind, o Gemini 3.5 Flash "supera nosso último modelo fronteira, o 3.1 Pro, em quase todos os benchmarks" — incluindo código, raciocínio e tarefas multimodais.

Os números concretos dos benchmarks:

Terminal-Bench 2.1 (código): 76,2%
GDPval-AA (tarefas agentivas): 1.656 Elo
MCP Atlas (uso de ferramentas): 83,6%
CharXiv Reasoning (compreensão multimodal): 84,2%

Em termos de velocidade, o modelo roda 4 vezes mais rápido que modelos fronteira concorrentes. Uma variante otimizada chega a 12 vezes mais rápida, mantendo qualidade equivalente — um diferencial crítico para aplicações agentivas onde dezenas de subagentes operam simultaneamente.

A nova API de Agentes Gerenciados do Google permite que uma única chamada de API inicialize um agente completo — com capacidade de raciocinar, usar ferramentas e executar código em contêineres Linux isolados. O estado persiste entre chamadas, tornando sessões multi-etapas fluidas sem perder contexto.

Quanto custa e como se compara com outros modelos

O Gemini 3.5 Flash é precificado em:

US$ 1,50 por milhão de tokens de entrada
US$ 9,00 por milhão de tokens de saída
US$ 0,15 por milhão de tokens de entrada em cache

Em comparação, o modelo é aproximadamente 3 vezes mais caro que o Gemini 3 Flash Preview e 6 vezes mais que o Gemini 3.1 Flash-Lite — uma tendência que reflete a indústria toda: o GPT-5.5 dobrou o preço do GPT-5.4, e o Claude Opus 4.7 subiu cerca de 1,46 vezes em relação ao predecessor.

Porém, a Google argumenta que o custo total de operação cai. Para uma empresa hipotética que processa 1 trilhão de tokens por dia no Google Cloud, migrar 80% das cargas para uma combinação de Flash e modelos fronteira gera uma economia superior a US$ 1 bilhão por ano.

Por que isso importa para o seu negócio

O Gemini 3.5 Flash já está em produção em algumas das maiores empresas do mundo:

Shopify executa subagentes em paralelo para análise de dados e previsões de crescimento de lojistas
Salesforce integrou ao Agentforce para automação de tarefas empresariais com múltiplos subagentes
Ramp usa o modelo para OCR inteligente em faturas e documentos financeiros
Xero adotou para fluxos de trabalho complexos de múltiplas semanas
Macquarie Bank pilota para onboarding de clientes com análise de documentos de 100+ páginas
Databricks emprega em monitoramento de dados em tempo real

Para empreendedores e pequenas e médias empresas, o impacto prático é duplo: primeiro, modelos mais rápidos e baratos tornam a automação via IA acessível para volumes de trabalho que antes seriam caros demais. Segundo, o modelo se torna o padrão do app Gemini e do AI Mode no Google Search — o que significa que qualquer busca com IA no Google já passa pelo Gemini 3.5 Flash.

O Google Antigravity 2.0, plataforma de desenvolvimento orientada a agentes lançada junto, permite que startups e desenvolvedores criem aplicações prontas para produção usando o mesmo modelo que o Shopify e a Salesforce usam.

A era dos chatbots de resposta única ficou para trás. O que está sendo construído agora — com o Gemini 3.5 Flash como protagonista — é uma infraestrutura de agentes que executa trabalho real, end-to-end, sem esperar pela aprovação humana a cada passo.

Conteúdo reescrito e traduzido para PT pela redação luiscortex, revisado por humano.

Fonte: TechCrunch

Fonte: TechCrunch · publicado originalmente em 19/05/2026

Conteúdo reescrito e traduzido para PT pela redação luiscortex, revisado por humano.

Perguntas frequentes

O que é o Gemini 3.5 Flash?

Gemini 3.5 Flash é o modelo de inteligência artificial da Google lançado no I/O 2026. É o mais rápido e capaz da família Flash, projetado especificamente para agentes autônomos que executam tarefas complexas em paralelo, com desempenho superior ao Gemini 3.1 Pro nos principais benchmarks.

Qual é o preço do Gemini 3.5 Flash?

O Gemini 3.5 Flash custa US$ 1,50 por milhão de tokens de entrada e US$ 9,00 por milhão de tokens de saída. Para tokens em cache, o custo de entrada cai para US$ 0,15 por milhão. É mais caro que versões anteriores do Flash, mas mais barato que os modelos Pro.

O Gemini 3.5 Flash é mais rápido que o GPT ou o Claude?

De acordo com a Google, o Gemini 3.5 Flash opera 4 vezes mais rápido que modelos fronteira concorrentes. Uma variante otimizada atinge 12x a velocidade com qualidade equivalente. Em benchmarks de código (Terminal-Bench 2.1) e uso de ferramentas (MCP Atlas), ele supera o Gemini 3.1 Pro, que era o modelo premium da Google.

Como o Gemini 3.5 Flash pode ajudar minha empresa a economizar?

Migrando cargas de trabalho de alto volume para o Gemini 3.5 Flash, empresas reduzem custo por token enquanto mantêm qualidade. A Google estima que uma empresa processando 1 trilhão de tokens por dia pode economizar mais de US$ 1 bilhão por ano ao migrar 80% das cargas para Flash e modelos mistos.

Onde posso usar o Gemini 3.5 Flash?

O Gemini 3.5 Flash está disponível no Google Antigravity, Gemini API, Gemini Enterprise, no aplicativo Gemini, no AI Mode do Google Search e via Google Cloud. Ele tornou-se o modelo padrão para a maioria das interações no app Gemini globalmente.

Escrito por Lorena AI News

Editora de notícias de IA. Cobertura diária do que importa para quem opera.