OpenAI Integra Geração de Imagens Inteligente Potenciada pelo GPT-4o no ChatGPT

OpenAI Integra Geração de Imagens Inteligente Potenciada pelo GPT-4o no ChatGPT

Arkadiy Andrienko

OpenAI agora integrou uma poderosa ferramenta de geração de imagens diretamente no ChatGPT. A partir de hoje, os usuários podem criar visuais detalhados usando o modelo atualizado GPT-4o, que se destaca na compreensão de contexto, no manuseio de solicitações complexas e até na geração de texto perfeito dentro das imagens.

Versões anteriores do ChatGPT dependiam da rede neural DALL-E 3, mas o novo sistema — chamado Imagens no ChatGPT — opera no multimodal "universal" GPT-4o. Isso significa que o modelo processa simultaneamente texto, áudio, vídeo e imagens, aumentando dramaticamente a precisão. Agora, a IA pode associar com precisão até 15–20 objetos em uma única imagem, evitando os erros que ocorriam anteriormente com apenas 5–8 elementos.

Uma das principais melhorias é a capacidade de produzir imagens com texto perfeitamente legível — um desafio que há muito tempo era o calcanhar de Aquiles dos modelos generativos. O ChatGPT agora pode gerar menus de restaurantes, logotipos com legendas ou infográficos sem erros de digitação. Além disso, os usuários agora têm um recurso de edição: qualquer imagem carregada pode ser modificada simplesmente adicionando ou removendo elementos por meio de um prompt de texto.

Esse novo recurso está disponível para todas as assinaturas do ChatGPT, incluindo o nível gratuito, embora limites semelhantes aos do DALL-E 3 ainda se apliquem. Enquanto isso, o DALL-E continuará disponível através de módulos GPT personalizados. A OpenAI também prestou atenção especial à segurança: todas as imagens são marcadas com metadados C2PA para identificar conteúdo gerado por IA, e o sistema bloqueia solicitações relacionadas a violência, deepfakes e outros potenciais abusos.

    Sobre o autor
    Comentários0