Google revelou um modelo de IA especializado capaz de realizar tarefas na internet por conta própria. O sistema analisa a tela e executa ações que um usuário normalmente faria—clicando em links, preenchendo formulários e organizando dados.
A tecnologia funciona de maneira semelhante a um assistente humano. Ao receber uma tarefa, o modelo estuda o estado atual da interface, determina a ação necessária e a executa. Em seguida, ele reavalia a tela atualizada para decidir o próximo passo. Esse ciclo iterativo continua até que a tarefa completa esteja finalizada.
Na prática, isso automatiza uma ampla gama de operações rotineiras. O sistema pode, por exemplo, transferir informações de um banco de dados para outro, organizar notas em um quadro virtual ou agendar um compromisso fazendo login em um site tudo por conta própria.
Os desenvolvedores enfatizam que para operações de maior risco, como transações financeiras, o sistema solicitará a confirmação do usuário. Ele também inclui salvaguardas integradas projetadas para evitar abusos. Embora o modelo esteja atualmente ajustado para uso em navegadores, espera-se que eventualmente execute tarefas dentro de um sistema operacional. Os desenvolvedores podem explorar suas capacidades por meio de um conjunto dedicado de ferramentas de API.
Em um desenvolvimento relacionado, o Google expandiu significativamente o suporte a idiomas para seu recurso de busca com IA (Modo IA). Agora, ele pode entender e gerar respostas em quase 50 idiomas e está disponível em mais de 200 países. De acordo com a empresa, essa inovação foi possível ao adaptar seu modelo Gemini, que aprendeu a levar em conta as nuances linguísticas e as especificidades culturais de cada idioma.
Essa medida efetivamente quebra barreiras linguísticas para milhões de usuários, ampliando o alcance da tecnologia muito além do mundo de língua inglesa. No entanto, para proprietários de sites e editores online, essa expansão provavelmente apresenta um novo desafio. Pesquisas indicam que as respostas detalhadas da IA diretamente nos resultados de busca podem reduzir a probabilidade de os usuários clicarem em sites de terceiros, potencialmente impactando o tráfego da web no futuro.