Notícias Hardware e Tecnologias O mais recente modelo de IA da DeepSeek agora é 2,5 vezes mais rápido

O mais recente modelo de IA da DeepSeek agora é 2,5 vezes mais rápido

Arkadiy Andrienko
Ler na versão completa

A startup chinesa de IA DeepSeek revelou uma versão atualizada de sua rede neural, DeepSeek-V3.1. Este novo modelo introduz suporte para processadores chineses, um grande aumento de velocidade e um novo modo híbrido. O DeepSeek-V3.1 utiliza um novo tipo de computação, UE8M0 FP8, que reduz a carga de memória e acelera o processamento de dados. Este é um desenvolvimento particularmente crucial, dado o crescente número de restrições à importação de semicondutores ocidentais.

De acordo com seus criadores, o novo modelo opera 2,5 vezes mais rápido que seu antecessor e suporta uma janela de contexto de 128K tokens—o dobro do modelo anterior. Os usuários agora podem alternar entre os modos de pensamento "profundo" e padrão com um botão na interface, permitindo uma gestão flexível dos recursos do modelo com base na tarefa em questão.

O novo modelo continua completamente gratuito para uso em sua interface de chat. Para desenvolvedores, os preços de acesso à API estão mudando: a partir de 6 de setembro, a integração será mais barata a $0,07 por 1 milhão de tokens de entrada. O DeepSeek-V3.1 obteve pontuações impressionantes em benchmarks. Ele marcou 53,1% no SVG Bench, superando o Gemini 2.5 Flash e o GPT-5 Chat. Também alcançou uma pontuação de 71,6% no teste ADA.

O modelo de código aberto está disponível para download no Hugging Face, permitindo que os usuários o executem localmente em seu próprio hardware.

Este lançamento ocorre pouco depois que a OpenAI lançou seu novo modelo GPT-5 no início de agosto. Embora sua versão base também esteja disponível para todos os usuários sem uma assinatura, seu lançamento foi recebido com críticas, levando a empresa a restaurar o acesso ao seu modelo anterior, GPT-4o, apesar de seu desempenho inferior em benchmarks.

    Sobre o autor
    Comentários0
    Deixar um comentário