Quão inteligente é o chatbot «Assustadoramente Inteligente» de Elon Musk?
              Fazil Dzhyndzholiia
            
            
            
            xAI apresentou um novo modelo de linguagem, Grok 3, que o fundador da empresa, Elon Musk, chamou de "a IA mais inteligente da Terra." Os criadores do chatbot afirmam que a nova versão supera significativamente a anterior: ela processa um volume maior de dados de treinamento e possui novos mecanismos de autocorreção. A versão demo do Grok 3 foi lançada hoje, e as primeiras avaliações já surgiram.
O que há de novo
A principal vantagem do Grok 3 é o acesso a recursos computacionais aprimorados. O chatbot é treinado usando o supercomputador Colossus: nas etapas iniciais, seus criadores utilizaram 100.000 NVIDIA H100 GPUs, depois dobrando esse número. No futuro, espera-se que o poder computacional aumente cinco vezes.
O Grok 3 inclui mecanismos de autocorreção integrados. A IA analisa suas próprias respostas, compara-as com respostas de referência e, em seguida, faz ajustes. Curiosamente, o chatbot recebe "recompensas" por respostas precisas e "penalidades" por chamadas "alucinações" — informações incorretas ou fabricadas.
De acordo com representantes da xAI, o Grok 3 é mais inteligente do que outros modelos em matemática, ciências naturais e programação. Testes cegos foram usados para avaliar a qualidade das respostas, o que significa que os usuários não sabiam qual chatbot estava respondendo.
Durante a apresentação do Grok 3, a xAI também apresentou o Deep Search — um agente de busca "de próxima geração" capaz de encontrar e analisar informações online rapidamente. Embora recursos semelhantes existam em modelos concorrentes, a xAI afirma que o Deep Search é mais preciso.
Além disso, o Grok 3 em breve receberá uma interface de voz, permitindo que os usuários interajam com ele como se estivessem falando com uma pessoa real. Diz-se que sua voz soa mais natural e expressiva do que os modelos concorrentes.
Como ele se sai na prática
Usuários na rede social X podem acessar o novo chatbot assinando o X Premium+ por $50 por mês. Embora ainda não haja muitas avaliações iniciais do Grok 3, algumas se destacam.
Por exemplo, um usuário chamado Penny2x compartilhou que criou um jogo totalmente funcional usando a nova versão da IA:
O Grok 3 foi lançado recentemente. Você não vai acreditar, eu já criei um jogo.
(Eu tive acesso antecipado ESTA MANHÃ).
Este jogo foi 100% criado pelo GROK, eu apenas disse o que queria e coloquei o código no lugar certo.
Eu só continuo pedindo ajustes, e ele continua gerando o jogo em um único arquivo que posso colocar na minha área de trabalho e executar.
O jogo mudou para sempre. Eu tenho desenvolvido muito com IA de todos os outros principais construtores de IA ultimamente, tentando decidir qual eu gosto mais, e grok é um JOGADOR. Eu não tenho benchmarks oficiais, e ainda não configurei a API, então não é meu fluxo de trabalho normal, mas parecia tão capaz quanto Sonet, 4o, ou qualquer outra coisa.
Nos próximos dias, vou configurá-lo como parte do meu fluxo de trabalho no NVIM e colocá-lo para trabalhar de verdade.
Isso é incrível. Vivemos no futuro. Todos são desenvolvedores agora.
Ainda mais interessante é o que o cofundador da OpenAI, Andrej Karpathy, pensa sobre o Grok 3. Ele também testou o novo modelo de linguagem. De acordo com Karpathy, em algumas áreas, o chatbot rivaliza com os principais concorrentes:
...Grok 3 claramente possui um modelo de pensamento de última geração (botão "Think") e se saiu muito bem na minha pergunta sobre Settlers of Catan:
"Crie uma página da web de jogo de tabuleiro mostrando uma grade hexagonal, assim como no jogo Settlers of Catan. Cada grade hexagonal é numerada de 1..N, onde N é o número total de peças hexagonais. Faça genérico, para que se possa mudar o número de "anéis" usando um controle deslizante. Por exemplo, em Catan, o raio é de 3 hexágonos. Página HTML única, por favor."
Poucos modelos acertam isso de forma confiável. Os principais modelos de pensamento da OpenAI (por exemplo, o1-pro, a $200/mês) também conseguem, mas todos os DeepSeek-R1, Gemini 2.0 Flash Thinking e Claude não.
Andrej Karpathy também apreciou a determinação do Grok 3:
Eu gosto que o modelo tentará resolver a hipótese de Riemann quando solicitado, semelhante ao DeepSeek-R1, mas ao contrário de muitos outros modelos que desistem instantaneamente (o1-pro, Claude, Gemini 2.0 Flash Thinking) e simplesmente dizem que é um grande problema não resolvido. Eu tive que pará-lo eventualmente porque me senti um pouco mal por ele, mas ele mostrou coragem, e quem sabe, talvez um dia...
No entanto, houve algumas desvantagens. O agente de Pesquisa Profunda levantou algumas preocupações:
…o modelo não parece gostar de referenciar X como uma fonte por padrão, embora você possa pedir explicitamente. Algumas vezes eu o peguei alucinado URLs que não existem. Algumas vezes ele disse coisas factuais que eu acho que estão incorretas e não forneceu uma citação para isso (provavelmente não existe).
Em conclusão, Andrej Karpathy observou que, com base nas impressões iniciais, o Grok 3 se aproximou do nível dos principais modelos da OpenAI, como o o1-pro ($200 por mês), e até mesmo supera ligeiramente o DeepSeek-R1 e o Gemini 2.0 Flash Thinking. Considerando que a equipe da xAI começou a desenvolver essa IA do zero há cerca de um ano, o progresso é impressionante. No entanto, testes mais abrangentes são necessários antes de determinar se o chatbot realmente merece o título de "o mais inteligente."
Preocupações com Viés
Não é segredo que Elon Musk participa ativamente da vida política dos EUA e expressa abertamente suas opiniões. Alguns usuários da internet se preocupam que o Grok 3 também possa promover certas narrativas.
Essas preocupações não são infundadas: Musk compartilhou uma captura de tela mostrando o chatbot criticando um veículo de mídia enquanto elogiava o X como a fonte de informação mais confiável. Isso é apesar do Grok 3 ser posicionado como um produto com censura mínima. Muitas pessoas acreditam que a IA deve permanecer neutra em seus julgamentos.
***
Independentemente disso, o lançamento de outro modelo de linguagem promissor marca um marco importante na corrida contínua da IA. Quanto maior a competição, mais rápido o progresso avança.
O que você acha do Grok 3? Compartilhe seus pensamentos nos comentários.
- 
  
    
      
    
    As melhores redes neurais para geração de conteúdo em janeiro-fevereiro de 2025 - 
  
    
      
    
    Elon Musk Anuncia Inesperadamente a Venda da Rede Social X - 
  
    
      
    
    Elon Musk Critica Novamente os Jogos 'Woke', Promete Abrir Seu Próprio Estúdio - 
  
    
      
    
    A Pesquisa do ChatGPT Torna-se Mais Acessível — OpenAI Desafia os Gigantes da Pesquisa - 
  
    
      
    
    Grok 3 Fica Grátis: Elon Musk Libera a IA Mais Inteligente do Mundo 





