Google Apresenta IA Capaz de Navegar na Web Como um Humano — Mas o Trabalho Real Está Apenas Começando
O modelo Gemini 2.5 Computer Use visa assumir tarefas digitais repetitivas, mas usuários iniciais devem se preparar para contratempos.
A Google DeepMind lançou seu modelo Gemini 2.5 Computer Use, um sistema de IA que consegue clicar, digitar e rolar por sites e aplicativos de forma muito semelhante a uma pessoa. O modelo, disponível agora em versão prévia através da API do Gemini, representa um grande passo para transformar a IA em um assistente prático capaz de lidar com as tarefas digitais repetitivas que muitos de nós detestamos.
Veja como funciona: a IA examina uma captura de tela, interpreta o que o usuário deseja, verifica seus movimentos anteriores e, em seguida, decide o que fazer a seguir — clicar em um botão, preencher um formulário, rolar a página para baixo. Após cada ação, ela recebe outra captura de tela, e o ciclo continua até que a tarefa seja concluída ou o modelo trave.
O Google afirma que o Gemini 2.5 atinge mais de 70% de precisão com um tempo médio de tarefa de cerca de 225 segundos. Em benchmarks padrão como Online-Mind2Web, WebVoyager e AndroidWorld, ele está superando os concorrentes. Dentro do Google, equipes já estão usando-o para testes de interface de usuário, o Projeto Mariner e novas funcionalidades no Modo IA da Busca.
Alguns testadores iniciais estão impressionados. “O Gemini 2.5 Computer Use está muito à frente de qualquer outra coisa que tentamos — 50% mais rápido e mais preciso do que ferramentas concorrentes”, disse a Poke.com, um serviço de assistente de IA no programa piloto do Google.
Ainda assim, nem todos estão prontos para celebrar. Nossos próprios engenheiros da CTOL.digital consideraram o sistema “promissor para automação e testes de navegador”, mas também “prematuro, focado na web e caprichoso quando as tarefas se complicam”. O veredito deles: é útil agora, mas precisa de grandes melhorias em velocidade e confiabilidade antes de poder ser verdadeiramente transformador.

Segurança por Design — Ou Apenas para Exibição?
Uma coisa que diferencia o modelo do Google é a forma como ele aborda a segurança. Cada ação passa por um serviço de segurança antes da execução, o que ajuda a proteger contra três riscos principais: uso indevido por parte dos usuários, o próprio modelo fazendo algo inesperado ou prompts maliciosos ocultos em sites.
Os desenvolvedores podem até exigir confirmação do usuário antes de etapas arriscadas, como compras, desvios de CAPTCHA ou controle de sistemas sensíveis. Ao contrário dos rivais que adicionam filtros depois, o Google treinou essas salvaguardas no próprio modelo.
Isso pode ser uma grande vantagem. Nossos analistas observaram: “Revisões por ação e políticas em nível de sistema são os padrões corretos. Isso não bloqueará todas as injeções de prompt, mas torna a adoção empresarial muito mais suave, especialmente em setores regulados”.
Se o Google transformar esse revisor em um serviço autônomo e personalizável — permitindo que as empresas insiram suas próprias regras e aprovações — isso poderia dar à gigante da tecnologia uma verdadeira vantagem de mercado.
O Que Ele Pode Fazer — e O Que Não Pode
Atualmente, o Gemini 2.5 se destaca em navegadores da web. Ele mostra potencial com aplicativos móveis, mas o controle de sistemas operacionais em nível de desktop permanece fora de alcance. Isso pode, na verdade, ser intencional.
“A maioria das automações mais valiosas fica por trás de logins da web — coisas como formulários, consoles de administração e ferramentas SaaS”, observou nossa equipe. “Loops mais rápidos e precisos na web superam o controle desajeitado de SO para a maioria dos fluxos de trabalho empresariais.”
Os pontos ideais parecem ser automação baseada em navegador, testes de UI, navegação estruturada em sites e entrada de dados. De fato, a equipe de pagamentos do Google afirma que usar o Gemini 2.5 como um backup para testes frágeis de ponta a ponta reduziu o tempo de recuperação manual em dias.
Mas os limites são claros. As tarefas ainda levam minutos, não segundos, o que exclui o suporte ao cliente de alto volume. O desempenho diminui em problemas abertos ou desafios tipo quebra-cabeça. E no uso diário, a versão prévia varia o suficiente para que os desenvolvedores precisem de novas tentativas e supervisão humana.
Impacto nos Negócios e o Cenário Geral
Nossa análise sugere que os verdadeiros vencedores não serão as startups de “navegação de navegador por IA”. Elas parecem mais como funcionalidades do que empresas completas. A maior oportunidade reside na construção de soluções verticais — copilotos especializados para setores regulados, infraestrutura de testes resiliente, ferramentas de segurança e plataformas de monitoramento de desempenho.
“Empresas duráveis combinarão APIs nativas, automação de UI como fallback, fluxos de trabalho estruturados, verificações de segurança integradas e ferramentas de revisão amigáveis ao usuário”, explicou nossa equipe. “A barreira não é apenas o agente — é o conhecimento do processo, as integrações e os dados.”
A concorrência não está parada. A Anthropic está impulsionando a automação de desktop mais ampla através do Claude. Projetos de código aberto estão se multiplicando, dando aos desenvolvedores muitas alternativas. Empresas inteligentes projetarão sistemas flexíveis o suficiente para trocar de provedores à medida que a tecnologia amadurece, em vez de apostar em apenas um.
Conclusão
O Gemini 2.5 Computer Use é progresso, não mágica. Ele estabelece um novo patamar para como a IA navega no mundo digital, com recursos de segurança mais robustos e benchmarks competitivos. Mas ainda é infraestrutura — útil para automatizar trabalhos de rotina, não um agente de ficção científica que pode lidar com qualquer coisa que você lhe jogue.
Por enquanto, as empresas devem direcioná-lo para fluxos de trabalho bem definidos e de alto valor, com métricas de sucesso claras e planos de backup. A tecnologia ficará mais rápida e inteligente com o tempo. A verdadeira decisão é se deve adotar cedo e conviver com as arestas de hoje, ou esperar pela jornada mais suave que certamente virá à medida que o Google e seus rivais avançam a fronteira.
NÃO É CONSELHO DE INVESTIMENTO
