Notícias Hardware e Tecnologias NeuReality lança chip que libera todo o potencial da GPU para IA

NeuReality lança chip que libera todo o potencial da GPU para IA

Arkadiy Andrienko
Ler na versão completa

A startup israelense NeuReality lançou seu chip especializado NR1, visando um gargalo crítico: o uso ineficiente de Unidades de Processamento Gráfico (GPUs) em aplicações de IA. Embora as GPUs modernas focadas em IA tenham se tornado muito mais potentes, as Unidades Centrais de Processamento (CPUs) e as Placas de Interface de Rede (NICs) em servidores frequentemente não conseguem acompanhar o ritmo. Estimativas sugerem que essa incompatibilidade deixa as GPUs nesses sistemas ociosas, com apenas 30% a 50% de sua capacidade potencial.

Posicionado como "o cérebro por trás da inferência de IA", o chip NR1 assume todo o processo de coordenação entre GPUs, CPUs e a rede, acelerando drasticamente o processamento de dados. Fundamentalmente, o chip funciona com qualquer acelerador – seja da NVIDIA, AMD ou soluções especializadas. A NeuReality afirma que o NR1 permite a utilização quase total da GPU. Nos testes internos da empresa, uma única GPU executando um modelo de IA generativa apresentou desempenho 6,5 vezes maior em comparação com uma arquitetura de servidor padrão baseada em x86, consumindo a mesma quantidade de energia.

Essa tecnologia é particularmente promissora para:

  • Geração de recursos de jogos em tempo real, incluindo texturas, animações e linhas de voz.
  • Plataformas de jogos em nuvem e serviços de streaming que precisam de infraestrutura de IA escalável.
  • Desenvolvedores criando bots de IA e NPCs com recursos comportamentais avançados.
  • Moderação de conteúdo – da filtragem de bate-papo à análise de fluxos de vídeo.

A NeuReality também fornece um SDK e um kit de ferramentas Kubernetes para equipes de DevOps e MLOps, oferecendo um caminho simplificado para integração em estúdios de jogos e serviços em nuvem. À medida que a IA se torna cada vez mais essencial ao desenvolvimento de jogos – impulsionando tudo, desde a geração de conteúdo até análises sofisticadas do comportamento do jogador – reduzir custos e acelerar as computações se torna fundamental. O NR1 incorpora a tendência de desagregação de servidores, alocando as computações de IA em uma faixa de processamento separada e altamente otimizada.

Isso é especialmente relevante para estúdios que trabalham com IA generativa, modelos multimodais, processamento de imagens (incluindo gráficos fotorrealistas), síntese de voz e aprendizado de máquina em grandes volumes de dados de jogos. A chegada do NR1 destaca a crescente demanda do mercado por soluções especializadas que gerenciem recursos de forma eficiente durante tarefas complexas de IA, principalmente à medida que as operações aumentam.

    Sobre o autor
    Comentários0
    Deixar um comentário