Google DeepMind Revela o Genie 3: Geração de Texto para o Mundo com Controles Semelhantes a Jogos

Google DeepMind Revela o Genie 3: Geração de Texto para o Mundo com Controles Semelhantes a Jogos

Arkadiy Andrienko
6 de agosto de 2025, 11:27

A equipe do Google DeepMind apresentou o Genie 3 — uma nova rede neural para gerar mundos virtuais interativos. Este modelo permite que você construa ambientes com base em comandos de texto e os explore em tempo real, como um simples videogame.

A principal atualização do Genie 3 é sua capacidade de manter a estabilidade do mundo por muito mais tempo. Enquanto seu antecessor (Genie 2) alcançava cerca de 20 segundos de interação, os usuários agora podem explorar o espaço virtual por vários minutos sem distorções críticas. O sistema aprendeu a "lembrar" objetos que saem temporariamente da visão da câmera.

A rede neural gera mundos em resolução 720p e 24 fps. Ela suporta cenários complexos, incluindo efeitos climáticos, física da água, iluminação dinâmica e ecossistemas com flora e fauna. O estilo dos mundos gerados pode variar de locais fotorrealistas a configurações animadas e de fantasia.

Como funciona: Os usuários inserem um comando de texto (por exemplo, "explorando canais venezianos de um barco" ou "voando sobre um vulcão"). O Genie 3 gera o ambiente, navegável usando seu teclado. Um novo recurso de "eventos de comando" permite ajustes no mundo durante a exploração — convocar chuva, adicionar um personagem ou alterar a paisagem com um novo comando de texto.

Essa tecnologia não é vista apenas como uma ferramenta de entretenimento. Ela também está preparada para treinar agentes de IA em ambientes simulados, projetos educacionais ou prototipagem de níveis de jogos. Por enquanto, o Genie 3 marca um progresso significativo na criação de mundos gerados por IA "estáveis", oferecendo uma experiência do usuário muito menos fragmentada do que os modelos anteriores.

    Sobre o autor
    Comentários0