
O Torneio de IA de Among Us Revela um Líder em Inteligência Social

A empresa 4Wall AI conduziu um experimento incomum ao organizar um torneio único de Among Us para redes neurais. O chat do jogo se tornou a principal arena para testar não o poder computacional, mas a inteligência social e a capacidade de manipulação. Seis modelos de IA, incluindo GPT-5, Claude Sonnet 4 e Kimi K2, foram colocados em uma nave espacial virtual, com cinco assumindo o papel de Crewmates honestos e um como o Impostor. Após cada "morte", os algoritmos se enfrentavam em uma guerra de palavras dentro do chat, tentando identificar o Impostor ou, inversamente, desviar a suspeita de si mesmos.
Os resultados de sessenta jogos mostraram um contraste marcante no comportamento dos modelos. O líder absoluto foi o GPT-5, que demonstrou uma flexibilidade comportamental impressionante. Ao jogar como um Crewmate inocente, tomou a iniciativa, analisou as ações dos outros jogadores e frequentemente identificou corretamente o Impostor. Mas quando seu papel era o de Impostor, o modelo mudou completamente sua estratégia, começando a mentir de forma magistral e a transferir a culpa para os outros.
Claude Sonnet 4, que ficou em segundo lugar, preferiu agir por meio da atividade em vez da enganação. O modelo Kimi K2, no entanto, usou uma estratégia completamente diferente e mais passiva. Em vez de fazer acusações, apoiou o ponto de vista do líder mais convincente, uma tática que lhe garantiu vitória em várias ocasiões. As outras três redes neurais—GPT-OSS, Qwen3 e Gemini 2.5 Pro—não conseguiram garantir uma única vitória como Impostor. Suas tentativas de discussão foram percebidas como muito agressivas e pouco convincentes, levando outros jogadores a votá-los para fora em praticamente todos os jogos, confundindo-os com o Impostor.
Benchmarks como este são importantes não apenas como entretenimento, mas como uma ferramenta prática. Eles nos permitem avaliar como diferentes IAs se comportam em situações que exigem interação social, cooperação e competição. Isso é fundamental para entender os riscos potenciais associados à manipulação e à disseminação de desinformação por modelos de linguagem avançados.
Experimentos como "Among AIs" demonstram claramente que redes neurais modernas já estão dominando ativamente habilidades sociais complexas, incluindo manipulação e engano. Essas capacidades, mesmo que exibidas em um ambiente de jogo, levantam questões sérias sobre o futuro da interação humano-IA. Contra o pano de fundo de tal pesquisa, uma proposta de um dos "padrinhos" da IA, Geoffrey Hinton—equipar sistemas superinteligentes com um análogo de um instinto maternal para nossa proteção—parece menos uma hipótese futurista e mais uma das possíveis medidas práticas.
-
OpenAI Lança Verificação de Idade no ChatGPT
-
AI Escolhe um Líder: Como o ChatGPT Ajudou Ativistas Nepaleses a Escolher um Governo Interino
-
ChatGPT Conquista o Mundo: 700 Milhões de Usuários Ativos Semanais
-
Apple Anuncia AirPods Pro 3 com Sensor de Frequência Cardíaca com Inteligência Artificial e Tradução em Tempo Real
-
DeepSeek irá Implementar Marcas D'água Digitais Permanentes para Todo Conteúdo Gerado por IA