O que é o DeepSeek?

A empresa chinesa DeepSeek entrou no mercado ocidental da inteligência artificial com o lançamento do seu mais recente modelo de IA.

Esta notícia provocou um terramoto em Wall Street. As grandes empresas tecnológicas especializadas em inteligência artificial estão hoje a registar um dia completamente negro, com a Nvidia a cair mais de 12% no mercado antes da abertura e a exercer pressão sobre outras empresas ocidentais do setor, como a ASML. Por trás deste dia difícil, há um único protagonista: a DeepSeek, uma startup chinesa especializada em inteligência artificial que agitou todos os mercados com o lançamento do seu último modelo, o DeepSeek-R1, uma ferramenta que se diz capaz de superar os últimos modelos da OpenAI a um custo muito menor. Mas o que é exatamente a DeepSeek e qual poderá ser o seu impacto no mercado mundial da inteligência artificial? - Conheça a nossa oferta de ETFs de IA

Pânico nos futuros do índice tecnológico US100 (Nasdaq100) que esteve a cair mais de 5% antes da abertura do mercado dos EUA. Fonte: xStation5

O que é a DeepSeek?

A DeepSeek é uma empresa chinesa de inteligência artificial que está a causar sensação nos mercados à medida que a semana começa. O lançamento do seu modelo inovador de inteligência artificial, o DeepSeek-R1, que oferece um desempenho comparável ao dos melhores chatbots do mundo a um custo muito menor, está a desafiar a crença amplamente difundida de que o futuro da inteligência artificial exigirá quantidades crescentes de investimento, poder e energia para se desenvolver.

Fundada em maio de 2023 por Liang Wenfeng, a DeepSeek recebeu financiamento exclusivo do fundo de cobertura chinês High-Flyer, também pertencente a Liang Wenfeng, e apresentou vários modelos de linguagem de programação que lhe têm permitido conquistar um nicho na indústria.

Em novembro de 2023, a empresa apresentou o seu primeiro modelo de código aberto, o DeepSeek Coder, ao qual se seguiu o DeepSeek LLM, criado para competir com outros grandes modelos. Após estes lançamentos, a DeepSeek apresentou o DeepSeek-V2, um modelo lançado em maio de 2024, que recebeu alguma atenção na China por dois motivos: a sua eficiência e o seu baixo custo, duas características partilhadas com a sua última proposta, o DeepSeek-R1. Meses depois, em junho, a empresa lançou o DeepSeek-Coder-V2, uma versão melhorada do modelo anterior, capaz de suportar 338 linguagens de programação.

No entanto, o seu avanço internacional só ocorreria em 2025, com o lançamento explosivo dos seus dois últimos modelos: O DeepSeek-V3, um grande modelo de linguagem (LLM) com 671 mil milhões de parâmetros e treinado em apenas 2,7 milhões de horas, que oferece um desempenho semelhante ao dos principais intervenientes ocidentais do setor; e o DeepSeek-R1, uma ferramenta especializada de raciocínio avançado desenvolvida com base no DeepSeek V-3, que superou os modelos da OpenAI em vários testes de programação e matemática, abalando todos os mercados.

Principais caraterísticas do DeepSeek R-1

O DeepSeek-R1, o novo modelo lançado pela DeepSeek, é um modelo de linguagem com um orçamento limitado que pode aprender e melhorar automaticamente sem supervisão humana, obtendo resultados impressionantes com recursos limitados.

A empresa afirma ter utilizado apenas 2.048 chips Nvidia H800 e 5,5 milhões de dólares para treinar este novo modelo, o que é impressionante quando comparado com os valores gastos por outras empresas de renome, como a OpenAI e a Google. De acordo com a última análise, estima-se que o investimento em inteligência artificial por parte das grandes empresas tecnológicas norte-americanas tenha atingido 224 mil milhões de dólares só no ano passado, um valor muito superior ao gasto pela startup chinesa.

Além dos seus baixos custos, o DeepSeek-R1 caracteriza-se por ser um modelo de código aberto, pelo que qualquer pessoa pode verificar o seu funcionamento interno e descarregá-lo para uso próprio com total liberdade. Em suma, é um modelo completamente transparente e acessível, o que pode impulsionar a sua adoção entre a população.

Quais são as diferenças em relação ao OpenAI?

O modelo de IA do DeepSeek é de código aberto e distribuído sob uma licença MTI, permitindo que qualquer investigador o acesse e distribua, ao passo que a OpenAI, que originalmente começou como uma empresa de código aberto com a missão de beneficiar toda a humanidade, recentemente adotou um modelo de código fechado. Além disso, o custo de formação e desenvolvimento dos modelos do DeepSeek parece ser apenas uma fração do que é necessário para os melhores produtos da OpenAI ou da Meta Platforms.

Especificamente, o primeiro LLM de código aberto da DeepSeek, o DeepSeek-V3, lançado em dezembro passado, foi construído por menos de 6 milhões de dólares, usando chips H800 da Nvidia (NASDAQ: NVDA) para treino, um valor bastante inferior ao da OpenAI e de outras empresas ocidentais. Apesar deste baixo custo, o R1, construído a partir do V3, está ao nível do O1 da OpenAI, superando mesmo o ChatGPT em algumas tarefas complexas, como testes relacionados com problemas matemáticos ou avaliação de raciocínio avançado. - Conheça o papel da Nvidia na inovação de IA e transformação digital

No entanto, à semelhança de todos os outros modelos de inteligência artificial de fabrico chinês, o DeepSeek censura tópicos considerados politicamente sensíveis na China. Ao contrário do ChatGPT, o DeepSeek evita responder a perguntas sobre a Praça Tiananmen, o presidente Xi Jinping ou a possibilidade de a China invadir Taiwan, o que pode ser uma surpresa para os utilizadores internacionais.

Ainda assim, a aplicação móvel DeepSeek foi descarregada 1,6 milhões de vezes até 25 de Janeiro, tendo ficado em primeiro lugar nas lojas de aplicações para iPhone na Austrália, Canadá, China, Singapura, Estados Unidos e Reino Unido, de acordo com dados da App Figures. Os utilizadores elogiaram a transparência do DeepSeek, que mostra o seu trabalho e raciocínio ao responder a perguntas e pedidos.

Que impacto tem o DeepSeek no sector da inteligência artificial?

O sucesso do DeepSeek pode levar a OpenAI e outros fornecedores dos EUA a reduzir os seus preços para manter a sua liderança. Também coloca em causa as elevadas despesas de empresas como a Meta e a Microsoft (cada uma das quais se comprometeu com gastos de capital de 65 mil milhões de dólares ou mais este ano, sobretudo em infraestruturas de IA) se modelos mais eficientes puderem competir com despesas muito inferiores.

A sua eficiência põe em causa a necessidade de grandes despesas de capital para adquirir os mais recentes e poderosos aceleradores de IA de empresas como a Nvidia. Levanta também a possibilidade de a China ultrapassar os EUA nesta nova tecnologia em expansão, o que daria uma reviravolta à corrida à inteligência artificial a que temos assistido nos últimos anos.

Gráfico da cotação da Nvidia quando o mercado dos EUA abriu, ações estavam a cair mais de 12%. Fonte:xStation5

Este desenvolvimento levanta também a questão das restrições impostas pelos EUA à exportação desses semicondutores avançados para a China, que visavam impedir um avanço do tipo que o DeepSeek parece representar. Atualmente, as empresas ocidentais do setor da inteligência artificial estão a viver um dia negro, com a Nvidia a cair no mercado antes da abertura e a ASML, um dos principais intervenientes do setor europeu, a cair mais de 10%. Por seu lado, o índice tecnológico de referência norte-americano, o Nasdaq 100, está a recuar 3%, enquanto o S&P 500 escala ligeiras descidas. Em contrapartida, os índices asiáticos estão a assinalar uma sessão otimista, com o índice Hang Seng de Hong Kong a subir mais de 2%.

Tarifas potenciais de Trump: como elas podem afetar o DeepSeek?

O DeepSeek teve de contornar as restrições impostas pelos EUA à China no que se refere a semicondutores, que impediram o país de aceder aos chips mais poderosos do mundo, incluindo o H100 da Nvidia, cuja exportação foi proibida por Washington. O sucesso do laboratório sugere que o DeepSeek encontrou uma forma de contornar essas regras ou que as sanções de Washington não foram tão eficazes quanto o pretendido.

A resposta de Donald Trump não deverá tardar, mas, dados os progressos do DeepSeek, acreditamos que poderá acelerar a sua proposta de aplicação de uma tarifa de 60% sobre todos os bens importados e um conjunto de outras medidas. No entanto, a China demonstrou que a estratégia de restringir o acesso a recursos críticos, como os semicondutores avançados, teve o efeito contrário, encorajando Pequim a intensificar os seus esforços.

Como investir em inteligência artificial? - saiba mais como investir neste novo setor

Enquanto nos Estados Unidos as quedas se intensificaram ao longo da sessão, na China os índices terminaram o dia em alta, com destaque para os setores de tecnologia do país asiático.

No que diz respeito a investir no setor da inteligência artificial, os utilizadores da XTB podem optar por várias estratégias, como ações em empresas do setor, como a Nvidia (NVDA.US) ou a ASML (ASML.NL), ou vários ETFs com exposição ao setor, como o XAIX.DE ou o WTAI.UK. Além disso, quem quiser investir na China também pode fazê-lo através dos ETFs CNYA.DE (EUR) ou CNYB.UK (USD) ou do ETF KWBE.DE (EUR) ou do ETF KWEB.UK (USD), para obter exposição ao setor tecnológico.