Artigos Hardware e Tecnologias Quão inteligente é o chatbot «Assustadoramente Inteligente» de Elon Musk?

Quão inteligente é o chatbot «Assustadoramente Inteligente» de Elon Musk?

18 de fevereiro de 2025, 18:45

xAI apresentou um novo modelo de linguagem, Grok 3, que o fundador da empresa, Elon Musk, chamou de "a IA mais inteligente da Terra." Os criadores do chatbot afirmam que a nova versão supera significativamente a anterior: ela processa um volume maior de dados de treinamento e possui novos mecanismos de autocorreção. A versão demo do Grok 3 foi lançada hoje, e as primeiras avaliações já surgiram.

O que há de novo

A principal vantagem do Grok 3 é o acesso a recursos computacionais aprimorados. O chatbot é treinado usando o supercomputador Colossus: nas etapas iniciais, seus criadores utilizaram 100.000 NVIDIA H100 GPUs, depois dobrando esse número. No futuro, espera-se que o poder computacional aumente cinco vezes.

O Grok 3 inclui mecanismos de autocorreção integrados. A IA analisa suas próprias respostas, compara-as com respostas de referência e, em seguida, faz ajustes. Curiosamente, o chatbot recebe "recompensas" por respostas precisas e "penalidades" por chamadas "alucinações" — informações incorretas ou fabricadas.

De acordo com representantes da xAI, o Grok 3 é mais inteligente do que outros modelos em matemática, ciências naturais e programação. Testes cegos foram usados para avaliar a qualidade das respostas, o que significa que os usuários não sabiam qual chatbot estava respondendo.

Durante a apresentação do Grok 3, a xAI também apresentou o Deep Search — um agente de busca "de próxima geração" capaz de encontrar e analisar informações online rapidamente. Embora recursos semelhantes existam em modelos concorrentes, a xAI afirma que o Deep Search é mais preciso.

Além disso, o Grok 3 em breve receberá uma interface de voz, permitindo que os usuários interajam com ele como se estivessem falando com uma pessoa real. Diz-se que sua voz soa mais natural e expressiva do que os modelos concorrentes.

{poll4570}

Como ele se sai na prática

Usuários na rede social X podem acessar o novo chatbot assinando o X Premium+ por $50 por mês. Embora ainda não haja muitas avaliações iniciais do Grok 3, algumas se destacam.

Por exemplo, um usuário chamado Penny2x compartilhou que criou um jogo totalmente funcional usando a nova versão da IA:

O Grok 3 foi lançado recentemente. Você não vai acreditar, eu já criei um jogo.

(Eu tive acesso antecipado ESTA MANHÃ).

Este jogo foi 100% criado pelo GROK, eu apenas disse o que queria e coloquei o código no lugar certo.

Eu só continuo pedindo ajustes, e ele continua gerando o jogo em um único arquivo que posso colocar na minha área de trabalho e executar.

O jogo mudou para sempre. Eu tenho desenvolvido muito com IA de todos os outros principais construtores de IA ultimamente, tentando decidir qual eu gosto mais, e grok é um JOGADOR. Eu não tenho benchmarks oficiais, e ainda não configurei a API, então não é meu fluxo de trabalho normal, mas parecia tão capaz quanto Sonet, 4o, ou qualquer outra coisa.

Nos próximos dias, vou configurá-lo como parte do meu fluxo de trabalho no NVIM e colocá-lo para trabalhar de verdade.

Isso é incrível. Vivemos no futuro. Todos são desenvolvedores agora.

Ainda mais interessante é o que o cofundador da OpenAI, Andrej Karpathy, pensa sobre o Grok 3. Ele também testou o novo modelo de linguagem. De acordo com Karpathy, em algumas áreas, o chatbot rivaliza com os principais concorrentes:

...Grok 3 claramente possui um modelo de pensamento de última geração (botão "Think") e se saiu muito bem na minha pergunta sobre Settlers of Catan:

"Crie uma página da web de jogo de tabuleiro mostrando uma grade hexagonal, assim como no jogo Settlers of Catan. Cada grade hexagonal é numerada de 1..N, onde N é o número total de peças hexagonais. Faça genérico, para que se possa mudar o número de "anéis" usando um controle deslizante. Por exemplo, em Catan, o raio é de 3 hexágonos. Página HTML única, por favor."

Poucos modelos acertam isso de forma confiável. Os principais modelos de pensamento da OpenAI (por exemplo, o1-pro, a $200/mês) também conseguem, mas todos os DeepSeek-R1, Gemini 2.0 Flash Thinking e Claude não.

Andrej Karpathy também apreciou a determinação do Grok 3:

Eu gosto que o modelo tentará resolver a hipótese de Riemann quando solicitado, semelhante ao DeepSeek-R1, mas ao contrário de muitos outros modelos que desistem instantaneamente (o1-pro, Claude, Gemini 2.0 Flash Thinking) e simplesmente dizem que é um grande problema não resolvido. Eu tive que pará-lo eventualmente porque me senti um pouco mal por ele, mas ele mostrou coragem, e quem sabe, talvez um dia...

No entanto, houve algumas desvantagens. O agente de Pesquisa Profunda levantou algumas preocupações:

…o modelo não parece gostar de referenciar X como uma fonte por padrão, embora você possa pedir explicitamente. Algumas vezes eu o peguei alucinado URLs que não existem. Algumas vezes ele disse coisas factuais que eu acho que estão incorretas e não forneceu uma citação para isso (provavelmente não existe).

Em conclusão, Andrej Karpathy observou que, com base nas impressões iniciais, o Grok 3 se aproximou do nível dos principais modelos da OpenAI, como o o1-pro ($200 por mês), e até mesmo supera ligeiramente o DeepSeek-R1 e o Gemini 2.0 Flash Thinking. Considerando que a equipe da xAI começou a desenvolver essa IA do zero há cerca de um ano, o progresso é impressionante. No entanto, testes mais abrangentes são necessários antes de determinar se o chatbot realmente merece o título de "o mais inteligente."

Preocupações com Viés

Não é segredo que Elon Musk participa ativamente da vida política dos EUA e expressa abertamente suas opiniões. Alguns usuários da internet se preocupam que o Grok 3 também possa promover certas narrativas.

Essas preocupações não são infundadas: Musk compartilhou uma captura de tela mostrando o chatbot criticando um veículo de mídia enquanto elogiava o X como a fonte de informação mais confiável. Isso é apesar do Grok 3 ser posicionado como um produto com censura mínima. Muitas pessoas acreditam que a IA deve permanecer neutra em seus julgamentos.

***

Independentemente disso, o lançamento de outro modelo de linguagem promissor marca um marco importante na corrida contínua da IA. Quanto maior a competição, mais rápido o progresso avança.

O que você acha do Grok 3? Compartilhe seus pensamentos nos comentários.

{poll4569}

Post foi traduzido Mostrar original (EN)

PC Artigos Hardware e Tecnologias

Sobre o autor

Fazil Dzhyndzholiia

Editor e colaborador

Eu escrevo sobre jogos desde 2013. Sou autor de centenas de matérias, análises, prévias e roteiros. Hoje em dia, jogo principalmente no PC, PlayStation 5 e Nintendo Switch 2. Meus gêneros favoritos são survival horror, souls-like e RPGs. Jogos favoritos: Bloodborne e Vampire: The Masquerade — Bloodlines. Séries favoritas: Resident Evil. Para mim, a jogabilidade é fundamental — uma boa história não salva mecânicas monótonas. Pelo menos, na maioria dos casos.

...Expandir

Comentários0