Nos últimos anos, a revolução da inteligência artificial começou a ser contada através de uma narrativa de investimento muito simples. No centro desta história encontra-se um único protagonista: a GPU. Os processadores gráficos tornaram-se o símbolo de uma nova era tecnológica, e a sua disponibilidade determinou diretamente quais as empresas capazes de treinar os modelos de linguagem mais avançados e quais as que ficaram para trás na corrida pelo futuro da IA.
Como resultado, o mercado aprendeu rapidamente a pensar na inteligência artificial através de um único indicador: o poder computacional. Mais GPUs significavam modelos maiores, modelos maiores significavam produtos melhores e produtos melhores significavam vantagem competitiva.
Com o tempo, no entanto, esta narrativa começou a tornar-se mais complexa. Verificou-se que o poder computacional bruto não é suficiente se o sistema for incapaz de fornecer dados à velocidade necessária. O estrangulamento já não era apenas as GPUs, mas cada vez mais também a memória — tanto a memória mais próxima do processador na forma de HBM, como a DRAM tradicional de servidor e toda a infraestrutura de armazenamento e transferência de dados.
Este foi o primeiro momento em que os investidores começaram a perceber que a revolução da IA não é uma história de um único componente, mas de toda uma cadeia tecnológica — desde o silício, passando pela memória, até aos sistemas de rede e refrigeração.
E agora, precisamente quando o mapa desta revolução parecia relativamente completo, surge outra mudança — muito menos óbvia, mas potencialmente tão importante quanto as anteriores.
Um papel cada vez mais importante está a ser desempenhado por uma camada que, durante anos, foi tratada como «infraestrutura óbvia»: a CPU. Num mundo em que a IA já não é uma única consulta a um modelo, mas assemelha-se, em vez disso, a um sistema complexo de agentes autónomos que executam tarefas em várias etapas, não só a escala da computação está a mudar, mas, acima de tudo, a sua natureza.
Neste ponto, surge uma questão que, há pouco tempo, parecia secundária. Será que a CPU, que anteriormente atuava como coordenadora e parceira discreta da GPU, está de facto a tornar-se um dos componentes-chave de toda a arquitetura de IA?
E, se assim for, isso significa que estamos a entrar numa terceira vaga da revolução da IA, após as GPUs e a memória, na qual o fator-chave já não será o poder computacional bruto, mas sim a nossa capacidade de ligar e orquestrar todo o sistema como um todo?
A ERA DA GPU
No início da revolução da IA, não havia muitas dúvidas sobre onde surgiria a sua base tecnológica. Com o avanço no deep learning e o surgimento de modelos de linguagem cada vez maiores, rapidamente se tornou claro que a principal limitação já não era o próprio algoritmo, mas sim a escala de computação necessária para o treinar.
Nesse momento, os processadores gráficos passaram para a ribalta. A sua arquitetura, originalmente concebida para renderizar gráficos e lidar com operações de imagem paralelas, revelou-se perfeitamente adequada ao tipo de computação exigido pelas redes neurais. Em vez de um único núcleo muito rápido, as GPUs oferecem milhares de unidades de processamento mais simples, capazes de realizar as mesmas operações em paralelo em conjuntos de dados massivos.
Foi isto que tornou as GPUs o motor natural da revolução da IA. O treino de modelos de linguagem, especialmente aqueles baseados em arquiteturas de transformador, resume-se em grande parte a operações matriciais — tarefas que podem ser facilmente paralelizadas. Na prática, isto significava que quanto mais potência de GPU pudesse ser concentrada num único sistema, maior seria o modelo que poderia ser treinado.
Como resultado, surgiu rapidamente um novo padrão para a infraestrutura de computação. Os centros de dados começaram a assemelhar-se a clusters de aceleradores especializados, onde as CPUs desempenhavam um papel de apoio, sendo responsáveis principalmente pela preparação de dados, gestão de processos e comunicação entre os componentes do sistema. Toda a «matemática pesada» foi transferida para as GPUs.
Esta arquitetura levou a uma forte concentração de valor num único segmento do mercado. À medida que a procura por potência de computação crescia, os fabricantes de GPUs capturaram a maior parte do valor económico da revolução da IA. O acesso às GPUs tornou-se não só uma vantagem tecnológica, mas também uma restrição estratégica que determinava o ritmo de desenvolvimento de empresas inteiras e laboratórios de investigação.
Neste contexto, o mercado começou a pensar na IA de uma forma muito linear. Mais GPUs significavam mais capacidade de computação, mais capacidade de computação significava modelos maiores e modelos maiores significavam melhores produtos. A lógica desta revolução parecia relativamente simples e bem compreendida.
Só com o tempo é que surgiram os primeiros sinais de que este quadro estava incompleto.

A MEMÓRIA COMO A SEGUNDA ONDA
À medida que os modelos de IA cresceram de milhões para mil milhões e depois para centenas de mil milhões de parâmetros, surgiu um problema que inicialmente não era tão óbvio como a falta de poder de computação. Verificou-se que o simples aumento do número de GPUs não resolve todas as limitações do sistema se os dados não puderem fluir com rapidez suficiente por toda a arquitetura de computação.
Nesta altura, a memória começou a ganhar destaque. Tanto a memória diretamente ligada às GPUs na forma de HBM, como a DRAM tradicional dos servidores e toda a camada de armazenamento e transferência de dados nos centros de dados. A memória tornou-se o fator determinante da velocidade a que modelos cada vez maiores podiam ser treinados e executados.
Na prática, isto significava que mesmo as GPUs mais avançadas eram incapazes de utilizar plenamente o seu potencial se não fossem devidamente «alimentadas» com dados. O estrangulamento já não era a computação em si, mas a capacidade do sistema para manter um fluxo contínuo de informação entre a memória, a rede e os aceleradores.
Este foi o momento em que a revolução da IA começou a passar de um problema puramente computacional para um problema de sistemas. Em vez de um único componente dominante, começámos a observar uma dependência cada vez mais complexa entre diferentes camadas da infraestrutura.
A memória, anteriormente tratada como um elemento de apoio, começou a desempenhar um papel estratégico. Soluções de alta largura de banda, como a HBM, tornaram-se um dos principais facilitadores do dimensionamento de modelos modernos, e os fabricantes de memória começaram a ocupar uma posição mais importante na cadeia de valor da revolução da IA.
É importante referir que esta fase não substituiu as GPUs, mas revelou antes as suas limitações naturais. À medida que os modelos eram dimensionados, tornou-se claro que a computação por si só não tem valor se não for apoiada por um débito de dados suficiente. Como resultado, o mercado começou gradualmente a reconhecer que a IA não é uma corrida isolada pelo processador mais potente, mas sim um sistema complexo no qual cada componente da infraestrutura pode tornar-se um potencial estrangulamento.
Foi então que se começou a formar uma compreensão mais completa da IA como um ecossistema, no qual, a par das GPUs, a memória, as redes e a infraestrutura de dados desempenham papéis essenciais.





A ASCENSÃO DA IA EM AGENTES
Durante muito tempo, o papel das CPUs na revolução da IA pareceu relativamente estável e bem definido. Eram responsáveis pela gestão do sistema, pela preparação de dados e pela coordenação do trabalho dos aceleradores de GPU, que executavam as tarefas computacionais mais pesadas. Nesta configuração, a CPU atuava como um operador de infraestrutura discreto, invisível da perspetiva do utilizador final e praticamente inalterado na sua função.

Este panorama está agora a mudar com o surgimento de uma nova classe de aplicações de IA, cada vez mais designadas por IA agentiva. Ao contrário dos modelos linguísticos tradicionais que respondem a comandos únicos, os sistemas baseados em agentes são concebidos para executar tarefas complexas de várias etapas que exigem não só a geração de respostas, mas também a realização de ações num ambiente digital.

Na prática, isto significa que, em vez de uma única consulta e uma única resposta, estamos a lidar com toda uma cadeia de operações. Um agente pode começar por analisar um problema, depois dividi-lo em etapas menores, executar uma série de consultas a sistemas externos, bases de dados ou APIs, processar a informação obtida e só então produzir um resultado final. Cada uma destas etapas requer operações de sistema separadas, comunicação com diferentes fontes de dados e gestão contínua do estado de todo o processo.

Neste novo modelo, a carga computacional começa a mudar. O modelo de linguagem em execução na GPU torna-se apenas uma parte de um sistema maior, responsável pela geração e interpretação da linguagem. O restante — lógica de controlo, gestão de tarefas, comunicação entre sistemas e manuseamento de ferramentas externas — sobrecarrega cada vez mais a CPU.
É aqui que surge uma mudança fundamental de perspetiva. Anteriormente, a CPU era tratada como uma camada de suporte cuja função era «não atrapalhar» a computação da GPU.
Resultados da Home Depot refletem a força do consumidor americano❓🛒
Previsão dos resultados da Nvidia: Será que irá sustentar os ganhos do mercado?
Ações da SAP disparam⚡Bolsas europeias estão a recuperar🟩
Calendário económico: Taxa de desemprego no Reino Unido sobe (19.05.2026)
Este material é uma comunicação de marketing na aceção do artigo 24.º, n.º 3, da Diretiva 2014/65 / UE do Parlamento Europeu e do Conselho, de 15 de maio de 2014, sobre os mercados de instrumentos financeiros e que altera a Diretiva 2002/92 / CE e Diretiva 2011/61/ UE (MiFID II). A comunicação de marketing não é uma recomendação de investimento ou informação que recomenda ou sugere uma estratégia de investimento na aceção do Regulamento (UE) n.º 596/2014 do Parlamento Europeu e do Conselho de 16 de abril de 2014 sobre o abuso de mercado (regulamentação do abuso de mercado) e revogação da Diretiva 2003/6 / CE do Parlamento Europeu e do Conselho e das Diretivas da Comissão 2003/124 / CE, 2003/125 / CE e 2004/72 / CE e do Regulamento Delegado da Comissão (UE ) 2016/958 de 9 de março de 2016 que completa o Regulamento (UE) n.º 596/2014 do Parlamento Europeu e do Conselho no que diz respeito às normas técnicas regulamentares para as disposições técnicas para a apresentação objetiva de recomendações de investimento, ou outras informações, recomendação ou sugestão de uma estratégia de investimento e para a divulgação de interesses particulares ou indicações de conflitos de interesse ou qualquer outro conselho, incluindo na área de consultoria de investimento, nos termos do Código dos Valores Mobiliários, aprovado pelo Decreto-Lei n.º 486/99, de 13 de Novembro. A comunicação de marketing é elaborada com a máxima diligência, objetividade, apresenta os factos do conhecimento do autor na data da preparação e é desprovida de quaisquer elementos de avaliação. A comunicação de marketing é elaborada sem considerar as necessidades do cliente, a sua situação financeira individual e não apresenta qualquer estratégia de investimento de forma alguma. A comunicação de marketing não constitui uma oferta ou oferta de venda, subscrição, convite de compra, publicidade ou promoção de qualquer instrumento financeiro. A XTB, S.A. - Sucursal em Portugal não se responsabiliza por quaisquer ações ou omissões do cliente, em particular pela aquisição ou alienação de instrumentos financeiros. A XTB não aceitará a responsabilidade por qualquer perda ou dano, incluindo, sem limitação, qualquer perda que possa surgir direta ou indiretamente realizada com base nas informações contidas na presente comunicação comercial. Caso o comunicado de marketing contenha informações sobre quaisquer resultados relativos aos instrumentos financeiros nela indicados, estes não constituem qualquer garantia ou previsão de resultados futuros. O desempenho passado não é necessariamente indicativo de resultados futuros, e qualquer pessoa que atue com base nesta informação fá-lo inteiramente por sua conta e risco.