Notícias Hardware e Tecnologias Nova IA Dá Vida a Fotos Estáticas, Criando Mundos em Movimento

Nova IA Dá Vida a Fotos Estáticas, Criando Mundos em Movimento

Arkadiy Andrienko
Ler na versão completa

O gigante tecnológico chinês Tencent apresentou uma nova ferramenta fascinante para criadores de conteúdo: um modelo de IA chamado HunyuanWorld-Voyager. Esta ferramenta pode gerar um vídeo curto a partir de uma única imagem estática, criando uma ilusão convincente de movimento da câmera dentro da cena.

Diferente de geradores de vídeo padrão como Sora, que essencialmente pintam uma sequência de quadros plausíveis, o Voyager se concentra em manter a consistência espacial. Isso significa que, à medida que a câmera "se move" para frente ou para os lados, os objetos na imagem não flutuam ou se deformam arbitrariamente. Em vez disso, eles mantêm suas proporções e posição, assim como fariam em um ambiente 3D real.

Um usuário faz o upload de qualquer imagem — digamos, uma foto do interior de um quarto ou uma paisagem. Em seguida, eles definem a trajetória que a câmera virtual deve seguir, e o sistema gera 49 quadros (aproximadamente 2 segundos de vídeo), que podem ser unidos em sequências mais longas.

Uma característica chave dessa tecnologia é sua geração simultânea de vídeo colorido e dados de profundidade quadro a quadro. Isso permite que o resultado seja convertido em uma nuvem de pontos 3D para modelagem adicional, o que pode ser extremamente útil para o desenvolvimento de jogos. No entanto, o modelo não cria um espaço 3D verdadeiro; ele imita habilmente um. Por causa disso, pode produzir erros em sequências mais longas ou ao tentar uma rotação completa de 360 graus.

A maior barreira para a adoção generalizada é a exigência de hardware. Para executar o modelo mesmo em sua qualidade mínima (540p), é necessário uma placa gráfica com pelo menos 60 GB de VRAM. Para resultados estáveis, placas de 80 GB são recomendadas — tais soluções são tanto caras quanto raras.

O modelo está formalmente disponível no Hugging Face, mas sua licença proíbe o uso dentro da União Europeia, do Reino Unido e da Coreia do Sul. Grandes empresas comerciais com um público de mais de 100 milhões de usuários também precisarão de um acordo separado com a Tencent.

Apesar de suas limitações atuais, o Voyager é intrigante para tarefas específicas de nicho. Por enquanto, no entanto, continua sendo mais uma ferramenta curiosa para entusiastas e profissionais do que um produto de mercado de massa. Especialistas observam que desenvolvimentos como este — da Tencent, Google (Genie 3) e outras startups — são os primeiros passos em direção a uma nova forma de arte digital generativa, onde um espectador pode sutilmente "mover" a câmera dentro de um mundo criado por IA.

    Sobre o autor
    Comentários0
    Deixar um comentário