¿Se convertirá la CPU en el nuevo Santo Grial de la inteligencia artificial?

En los últimos años, la revolución de la inteligencia artificial se ha narrado desde una perspectiva de inversión muy simple. En el centro de esta historia se encuentra un único protagonista: la GPU. Los procesadores gráficos se han convertido en el símbolo de una nueva era tecnológica, y su disponibilidad ha determinado directamente qué empresas son capaces de entrenar los modelos de lenguaje más avanzados y cuáles se quedan atrás en la carrera por el futuro de la IA.

Como resultado, el mercado aprendió rápidamente a concebir la inteligencia artificial a través de una única métrica: la potencia computacional. Más GPU significaban modelos más grandes, modelos más grandes significaban mejores productos, y mejores productos significaban una ventaja competitiva.

Sin embargo, con el tiempo, esta narrativa comenzó a volverse más compleja. Resultó que la potencia computacional bruta no es suficiente si el sistema no puede entregar los datos a la velocidad requerida. El cuello de botella ya no eran solo las GPU, sino cada vez más también la memoria: tanto la memoria más cercana al procesador en forma de HBM, como la DRAM tradicional de los servidores y toda la infraestructura de almacenamiento y transferencia de datos.

Este fue el primer momento en que los inversores comenzaron a comprender que la revolución de la IA no se reduce a un solo componente, sino a toda una cadena tecnológica: desde el silicio, pasando por la memoria, hasta las redes y los sistemas de refrigeración.

Y ahora, justo cuando el panorama de esta revolución parecía relativamente completo, surge otro cambio, mucho menos evidente, pero potencialmente tan importante como los anteriores.

Un papel cada vez más relevante lo desempeña una capa que durante años se consideró una "infraestructura obvia": la CPU. En un mundo donde la IA ya no se reduce a una simple consulta a un modelo, sino que se asemeja a un sistema complejo de agentes autónomos que realizan tareas de múltiples pasos, no solo cambia la escala de computación, sino sobre todo su naturaleza.

En este punto, surge una pregunta que hasta hace poco parecía secundaria: ¿Podría la CPU, que antes actuaba como coordinadora y colaboradora discreta de la GPU, estar convirtiéndose en uno de los componentes clave de toda la arquitectura de la IA?

Y si es así, ¿significa esto que estamos entrando en una tercera ola de la revolución de la IA después de las GPU y la memoria, en la que el factor clave ya no será la potencia de cálculo bruta, sino más bien la capacidad de conectar y orquestar todo el sistema en su conjunto?

La era de la GPU

Al comienzo de la revolución de la IA, no cabía duda de dónde surgiría su base tecnológica. Con el avance del aprendizaje profundo y la aparición de modelos de lenguaje cada vez más grandes, pronto quedó claro que la principal limitación ya no era el algoritmo en sí, sino la escala de computación necesaria para entrenarlo.

En ese momento, los procesadores gráficos cobraron protagonismo. Su arquitectura, diseñada originalmente para renderizar gráficos y gestionar operaciones de imagen en paralelo, resultó ser perfectamente adecuada para el tipo de computación que requieren las redes neuronales. En lugar de un único núcleo ultrarrápido, las GPU ofrecen miles de unidades de procesamiento más sencillas capaces de realizar las mismas operaciones en paralelo en conjuntos de datos masivos.

Esto convirtió a las GPU en el motor natural de la revolución de la IA. El entrenamiento de modelos de lenguaje, especialmente aquellos basados en arquitecturas Transformer, se reduce en gran medida a operaciones matriciales, tareas que se pueden paralelizar fácilmente. En la práctica, esto significaba que cuanta más potencia de GPU se pudiera concentrar en un solo sistema, mayor sería el modelo que se podría entrenar.

Como resultado, surgió rápidamente un nuevo estándar para la infraestructura de computación. Los centros de datos comenzaron a asemejarse a clústeres de aceleradores especializados, donde las CPU desempeñaban un papel secundario, encargándose principalmente de la preparación de datos, la gestión de procesos y la comunicación entre los componentes del sistema. Todas las operaciones matemáticas complejas se trasladaron a las GPU.

Esta arquitectura conllevó una fuerte concentración de valor en un único segmento del mercado. A medida que crecía la demanda de potencia de cálculo, los fabricantes de GPU acapararon la mayor parte del valor económico de la revolución de la IA. El acceso a las GPU se convirtió no solo en una ventaja tecnológica, sino también en una limitación estratégica que determinaba el ritmo de desarrollo de empresas y laboratorios de investigación enteros.

En este contexto, el mercado comenzó a concebir la IA de forma muy lineal. Más GPU significaban más capacidad de cálculo, más capacidad de cálculo significaba modelos más grandes, y modelos más grandes significaban mejores productos. La lógica de esta revolución parecía relativamente simple y bien comprendida.

Solo con el tiempo surgieron las primeras señales de que esta visión era incompleta.

LA MEMORIA COMO SEGUNDA OLA

A medida que los modelos de IA crecieron de millones a miles de millones y luego a cientos de miles de millones de parámetros, surgió un problema que inicialmente no era tan obvio como la falta de potencia de cálculo. Resultó que simplemente aumentar el número de GPU no resuelve todas las limitaciones del sistema si los datos no pueden fluir con la suficiente rapidez a través de toda la arquitectura de computación.

En este punto, la memoria comenzó a cobrar protagonismo. Tanto la memoria conectada directamente a las GPU en forma de HBM, como la DRAM tradicional de los servidores y toda la capa de almacenamiento y transferencia de datos en los centros de datos. La memoria se convirtió en el factor determinante de la velocidad a la que se podían entrenar y ejecutar modelos cada vez más grandes.

En la práctica, esto significaba que incluso las GPU más avanzadas no podían aprovechar todo su potencial si no se les proporcionaban los datos adecuados. El cuello de botella ya no era la computación en sí, sino la capacidad del sistema para mantener un flujo continuo de información entre la memoria, la red y los aceleradores.

Fue entonces cuando la revolución de la IA comenzó a pasar de ser un problema puramente computacional a un problema de sistemas. En lugar de un único componente dominante, comenzamos a observar una dependencia cada vez más compleja entre las diferentes capas de la infraestructura. La memoria, antes considerada un elemento de apoyo, comenzó a desempeñar un papel estratégico. Las soluciones de alto ancho de banda, como HBM, se convirtieron en uno de los principales facilitadores de la escalabilidad de los modelos modernos, y los fabricantes de memoria empezaron a ocupar una posición más importante en la cadena de valor de la revolución de la IA.

Es importante destacar que esta etapa no reemplazó a las GPU, sino que reveló sus limitaciones inherentes. A medida que los modelos escalaban, quedó claro que la capacidad de procesamiento por sí sola carece de valor si no está respaldada por un rendimiento de datos suficiente. Como resultado, el mercado comenzó a reconocer gradualmente que la IA no es una carrera por el procesador más potente, sino un sistema complejo en el que cada componente de la infraestructura puede convertirse en un cuello de botella potencial.

Fue entonces cuando comenzó a gestarse una comprensión más completa de la IA como un ecosistema, donde, junto con las GPU, la memoria, las redes y la infraestructura de datos desempeñan funciones esenciales.

LA CPU Y EL AUGE DE LA IA AGÉNICA

Durante mucho tiempo, el papel de las CPU en la revolución de la IA parecía relativamente estable y bien definido. Se encargaban de la gestión del sistema, la preparación de datos y la coordinación del trabajo de los aceleradores GPU, que realizaban las tareas computacionales más complejas. En este contexto, la CPU actuaba como un operador de infraestructura silencioso, invisible para el usuario final y con una función prácticamente inalterada.

Esta situación está cambiando con la aparición de una nueva clase de aplicaciones de IA, cada vez más conocidas como IA basadas en agentes. A diferencia de los modelos de lenguaje tradicionales que responden a consultas puntuales, los sistemas basados en agentes están diseñados para realizar tareas complejas de varios pasos que requieren no solo generar respuestas, sino también tomar acciones dentro de un entorno digital.

En la práctica, esto significa que, en lugar de una sola consulta y una sola respuesta, nos encontramos ante una cadena completa de operaciones. Un agente puede comenzar analizando un problema, luego dividirlo en pasos más pequeños, ejecutar una serie de consultas a sistemas externos, bases de datos o API, procesar la información obtenida y solo entonces producir un resultado final. Cada uno de estos pasos requiere operaciones de sistema independientes, comunicación con diferentes fuentes de datos y una gestión continua del estado de todo el proceso.

En este nuevo modelo, la carga computacional comienza a cambiar. El modelo de lenguaje que se ejecuta en la GPU se convierte en solo una parte de un sistema más amplio, responsable de la generación e interpretación del lenguaje. El resto —lógica de control, gestión de tareas, comunicación entre sistemas y manejo de herramientas externas— sobrecarga cada vez más la CPU.

Aquí es donde surge un cambio fundamental de perspectiva. Anteriormente, la CPU se consideraba una capa de soporte cuya función era "no interferir" con el cálculo de la GPU. Sin embargo, en el mundo de la IA con agentes, la CPU comienza a actuar como un coordinador activo que no solo gestiona el flujo de datos, sino que también participa en el proceso de toma de decisiones del sistema.

Es importante destacar que este no es un cambio superficial, sino estructural. Cada agente de IA realiza no uno, sino muchos pasos computacionales y operativos, lo que conlleva un marcado aumento de las operaciones ejecutadas fuera de la GPU. Como resultado, la importancia de la infraestructura de CPU aumenta, ya que debe gestionar una enorme cantidad de consultas, procesos e interacciones en tiempo real en paralelo.

En este punto, se hace visible el primer cambio arquitectónico real en los sistemas de IA. En lugar de un modelo centrado en un único tipo de computación, avanzamos hacia un sistema multicapa en el que diferentes componentes se encargan de distintas funciones operativas. Las GPU gestionan los cálculos matriciales, la memoria se encarga del almacenamiento y el flujo de datos, mientras que las CPU se convierten cada vez más en la capa responsable de la orquestación de todo el proceso.

CAMBIO DE LA ARQUITECTURA DEL SISTEMA

Con el creciente protagonismo de la IA basada en agentes, no solo está cambiando la forma en que se utilizan los modelos, sino también la arquitectura completa de los sistemas de IA. La división tradicional, donde las GPU se encargaban del cálculo y las CPU desempeñaban un papel de apoyo, resulta cada vez más insuficiente para el funcionamiento real de las aplicaciones de IA modernas.

En lugar de un único proceso computacional, nos encontramos cada vez más ante un sistema que se asemeja a una compleja red de capas que cooperan entre sí. El modelo de lenguaje sigue siendo el núcleo del razonamiento, pero a su alrededor se desarrolla una extensa infraestructura responsable de la memoria, el flujo de datos, la comunicación con las herramientas y la ejecución en tiempo real.

En esta configuración, la CPU ya no es solo una capa de soporte técnico para la GPU, sino que se convierte en la integradora de todo el sistema. Ahora asume una proporción cada vez mayor de responsabilidades relacionadas con la orquestación, la gestión del estado y el manejo de procesos complejos basados en agentes.

Como resultado, la IA deja de ser un único modelo para convertirse en un sistema operativo para procesos inteligentes, en el que diferentes tipos de hardware desempeñan funciones especializadas pero interdependientes.

ECONOMÍA DEL CAMBIO

El cambio más importante que se está produciendo en toda la infraestructura de IA no radica en cómo se construyen los sistemas, sino en cómo se distribuye la demanda de recursos computacionales. Durante mucho tiempo, el punto de referencia dominante fue la relación CPU-GPU, que en los clústeres de IA tradicionales estaba fuertemente sesgada hacia los aceleradores.

Con el auge de la IA automatizada, este equilibrio está cambiando gradualmente. En lugar de una arquitectura donde las CPU desempeñan un papel marginal y las GPU dominan el sistema, nos estamos moviendo hacia un modelo más equilibrado en el que los procesadores de propósito general asumen una proporción cada vez mayor de las cargas de trabajo relacionadas con la orquestación, el manejo de herramientas y el procesamiento de múltiples pasos.

Este cambio tiene consecuencias económicas directas. A medida que más operaciones se realizan fuera de las GPU, aumenta la demanda de potencia de CPU en los centros de datos, lo que conlleva un mayor número de núcleos necesarios por acelerador. Como resultado, la infraestructura de IA se vuelve más intensiva en recursos, no solo en términos de GPU, sino también en computación de propósito general.

Desde la perspectiva del sistema, esto genera un cambio estructural en la demanda a lo largo de la cadena de valor. La inversión de capital, que antes se centraba principalmente en GPU y memoria de alto ancho de banda, se está extendiendo cada vez más al segmento de CPU. Esto ejerce presión sobre las cadenas de suministro, aumenta la utilización de la capacidad de fabricación y redefine gradualmente las expectativas para el mercado de CPU de servidores.

En este contexto, la CPU ya no se considera un segmento maduro y estable, sino uno de los componentes clave de la infraestructura de IA, cuya importancia crece con la complejidad de los sistemas basados en agentes.

MERCADO DE CPU Y JUGADORES CLAVE

El papel cambiante de las CPU en la arquitectura de IA está transformando el panorama competitivo de la industria de semiconductores. Durante muchos años, el mercado de CPU para servidores fue relativamente estable y estuvo dominado por un único actor, pero con la llegada de la era de la IA basada en agentes, vuelve a ser un campo de intensa competencia tecnológica.

En el centro de esta competencia se encuentran tres fuerzas principales: AMD, Intel y Arm. Cada una representa un modelo de negocio, una arquitectura y un enfoque diferentes sobre lo que debe ser un procesador moderno en la era de la IA.

AMD es el principal beneficiario de los cambios en el segmento de servidores x86. Con sus procesadores EPYC, la compañía está aumentando constantemente su cuota de mercado, ofreciendo una alta eficiencia energética y un rendimiento competitivo por núcleo. En el contexto de la creciente demanda de CPU en sistemas basados en agentes, AMD también se beneficia de su capacidad para proporcionar tanto CPU como GPU, creando una pila de computación más completa para centros de datos.

Por otro lado, Intel se encuentra en una fase de transformación. Tras años de perder cuota de mercado en el sector de los servidores, intenta recuperar su posición mediante nuevas generaciones de procesadores Xeon y una estrategia centrada en el avance de sus procesos de fabricación. Sin embargo, el reto de Intel no es solo tecnológico, sino también estratégico: redefinir su papel en un ecosistema de IA que ha evolucionado en gran medida al margen de sus fortalezas históricas.

El tercer pilar es Arm, que opera en un nivel diferente de la cadena de valor. En lugar de fabricar chips, Arm proporciona la arquitectura que utilizan las grandes empresas tecnológicas para diseñar sus propios procesadores. Como resultado, una parte cada vez mayor del crecimiento de la demanda de CPU no se destina directamente a los fabricantes tradicionales, sino a los ecosistemas en la nube que desarrollan chips personalizados.

Esto conlleva un cambio estructural. El mercado de las CPU ya no es un simple duopolio de Intel y AMD, sino un ecosistema de múltiples capas donde los proveedores de servicios en la nube a gran escala, como AWS, Google y Microsoft, diseñan sus propios procesadores optimizados para cargas de trabajo específicas.

En este contexto, no existe un único ganador dominante. En cambio, observamos un mercado donde diferentes modelos de negocio y arquitecturas coexisten y compiten por una cuota creciente de la demanda de computación en la era de la IA.

LA TERCERA OLA DE LA IA Y SUS IMPLICACIONES

Al analizar la revolución de la IA desde la perspectiva de la infraestructura, emerge un patrón evolutivo claro, en el que las sucesivas capas del sistema se desplazan gradualmente desde un segundo plano hasta ocupar un lugar central. Primero llegó la computación mediante GPU, que permitió el desarrollo de los modelos de lenguaje modernos. Luego, la memoria cobró protagonismo, sin la cual la escalabilidad no habría sido posible. Ahora, las CPU se están convirtiendo cada vez más en la siguiente capa de esta cadena.

Este cambio no se debe a una moda tecnológica, sino a una evolución fundamental en el funcionamiento de los sistemas de IA. La transición de consultas simples a modelos de lenguaje y, posteriormente, a la IA con agentes, representa un cambio de cálculos sencillos a procesos de decisión complejos de múltiples pasos. En este entorno, la importancia de la gestión de tareas, la comunicación con sistemas externos y el manejo de operaciones paralelas aumenta significativamente.

Estas son precisamente las funciones que cada vez sobrecargan más a las CPU, que ya no son una capa de soporte, sino un componente integral del funcionamiento de los sistemas de IA.

Esto conlleva una revisión significativa de las expectativas respecto al tamaño del mercado de CPU para servidores. Las proyecciones que apuntan a un crecimiento superior a los 120.000 millones de dólares para 2030, y en escenarios más optimistas hasta los 200.000 millones de dólares, sugieren que las CPU ya no constituyen un segmento maduro y estable, sino más bien un ciclo de crecimiento independiente impulsado por la IA.

En esta nueva estructura, no hay un único ganador. AMD se beneficia de la creciente demanda en el segmento x86 y fortalece su posición como actor clave en la infraestructura de IA. Intel intenta aprovechar la renovada importancia de las CPU para reconstruir su posición, al tiempo que enfrenta desafíos tecnológicos y competitivos. Mientras tanto, Arm capta una cuota cada vez mayor del crecimiento basado en la nube, donde los proveedores de servicios en la nube diseñan chips personalizados para cargas de trabajo específicas.

La clave no reside en identificar un único ganador, sino en comprender que la CPU se está convirtiendo en una tercera ola paralela de la revolución de la IA, junto con las GPU y la memoria. Una ola que no reemplaza a las anteriores, sino que las complementa, creando una visión más completa de la infraestructura de IA.

Desde esta perspectiva, la revolución de la IA ya no es un único avance tecnológico, sino un proceso multifásico de redistribución de valor a lo largo de la cadena de valor de los semiconductores. Y la CPU, considerada durante mucho tiempo un componente secundario, está empezando a ocupar una posición en este sistema que pocos esperaban hasta hace poco.

19 de mayo de 2026, 13:18

NVIDIA publica resultados mañana: Wall Street tiembla

19 de mayo de 2026, 12:43

🟡Informe de materias primas: Petróleo, Gas Natural, Oro y Cacao

19 de mayo de 2026, 11:18

Blackstone se alía con Google: nace el rival que puede dominar el cómputo de IA

18 de mayo de 2026, 17:28

Subidas para el Ibex 35 en la primera jornada de una semana clave

El contenido que se presenta en la sección de FORMACIÓN sólo tiene fines informativos, educativos y de apoyo para utilizar la plataforma. El material presentado, incluyendo los análisis, precios, opiniones u otros contenidos, no es una recomendación de inversión o información que recomiende o sugiera una estrategia de inversión ni se incluye en el ámbito del asesoramiento en materia de inversión recogido en la Ley 6/2023 de los Mercados de Valores y de los Servicios de Inversión (artículo 125.1 g). Este vídeo se ha preparado sin tener en cuenta las necesidades del cliente ni su situación financiera individual.
XTB no aceptará responsabilidad por ningún tipo de pérdidas o daños, incluyendo, entre otros, cualquier lucro cesante, que pueda surgir directa o indirectamente del uso o dependencia de la información incluida en este vídeo. XTB S.A. no es responsable de las acciones u omisiones del cliente, especialmente por la adquisición o disposición de instrumentos financieros, realizados con base en la información que contiene este vídeo.
El rendimiento pasado no es necesariamente indicativo de resultados futuros y cualquier persona que actúe sobre esta información lo hace bajo su propio riesgo.
Copyright © XTB S.A. Todos los derechos reservados. Está prohibido copiar, modificar y distribuir este vídeo sin el consentimiento expreso de XTB S.A.

Acciones al Contado

Nombre de la cookie	Descripción
SERVERID
userBranchSymbol	Fecha de caducidad: 1 día
adobe_unique_id	Fecha de caducidad: 364 días
test_cookie	Fecha de caducidad: 1 hora
SESSID	Fecha de caducidad: 1 día
__hssc	Fecha de caducidad: 1 hora
__cf_bm	Fecha de caducidad: 1 hora
intercom-id-iojaybix	Fecha de caducidad: 270 días
intercom-session-iojaybix	Fecha de caducidad: 6 días
leavingBranchPopup
countryIsoCode
intercom-device-id-iojaybix	Fecha de caducidad: 270 días
xtbCookiesSettings	Fecha de caducidad: 364 días
TS5b68a4e1027
xtbLanguageSettings	Fecha de caducidad: 364 días
userPreviousBranchSymbol	Fecha de caducidad: 364 días
__cfruid
_cfuvid
_GRECAPTCHA	Fecha de caducidad: 179 días

Nombre de la cookie	Descripción
_gid	Fecha de caducidad: 1 día
_gaexp	Fecha de caducidad: 91 días
_gat_UA-16408788-1	Fecha de caducidad: 1 hora
_gat_UA-121192761-1	Fecha de caducidad: 1 hora
_gcl_au	Fecha de caducidad: 89 días
_ga_CBPL72L2EC	Fecha de caducidad: 729 días
_ga	Fecha de caducidad: 729 días
AnalyticsSyncHistory	Fecha de caducidad: 29 días
__hstc	Fecha de caducidad: 179 días
__hssrc
ln_or	Fecha de caducidad: 1 día
_hjSessionUser_1132297	Fecha de caducidad: 364 días
_hjFirstSeen	Fecha de caducidad: 1 hora
_hjIncludedInSessionSample	Fecha de caducidad: 1 hora
_hjSession_1132297	Fecha de caducidad: 1 hora
_hjIncludedInPageviewSample	Fecha de caducidad: 1 hora
_hjAbsoluteSessionInProgress	Fecha de caducidad: 1 hora
_vwo_uuid_v2	Fecha de caducidad: 365 días
_vwo_uuid	Fecha de caducidad: 365 días
_vwo_ds	Fecha de caducidad: 29 días
_vwo_sn	Fecha de caducidad: 1 hora
_vis_opt_s	Fecha de caducidad: 99 días
_vis_opt_test_cookie
__hssc	Fecha de caducidad: 1 hora
_ga_TC79BEJ20L	Fecha de caducidad: 729 días

Nombre de la cookie	Descripción
_omappvp	Fecha de caducidad: 3998 días
_omappvs	Fecha de caducidad: 1 hora
_fbp	Fecha de caducidad: 89 días
fr	Fecha de caducidad: 89 días
lang
_ttp	Fecha de caducidad: 389 días
_tt_enable_cookie	Fecha de caducidad: 389 días
hubspotutk	Fecha de caducidad: 179 días
omSeen-pyfa0xtqk5j72jwykxzy	Fecha de caducidad: 29 días
YSC
VISITOR_INFO1_LIVE	Fecha de caducidad: 179 días
VISITOR_PRIVACY_METADATA	Fecha de caducidad: 179 días
__Secure-ROLLOUT_TOKEN	Fecha de caducidad: 179 días
_rdt_uuid	Fecha de caducidad: 89 días
guest_id_marketing	Fecha de caducidad: 729 días
guest_id_ads	Fecha de caducidad: 729 días
personalization_id	Fecha de caducidad: 729 días
guest_id	Fecha de caducidad: 729 días
muc_ads	Fecha de caducidad: 729 días

Nombre de la cookie	Descripción
UserMatchHistory	Fecha de caducidad: 29 días
bcookie	Fecha de caducidad: 364 días
lidc	Fecha de caducidad: 1 día
lang
bscookie	Fecha de caducidad: 364 días
li_gc	Fecha de caducidad: 179 días