GPU et Calcul IA : Nvidia, AMD et Intel se Disputent le Marché des Puces pour l'Intelligence Artificielle

La guerre des puces : quand le silicium devient stratégique

Il y a encore cinq ans, parler de GPU dans une conversation mondaine vous valait des regards polis mais vides. Aujourd'hui, ces processeurs graphiques obsèdent les marchés financiers, les gouvernements et les entreprises tech les plus valorisées de la planète. Le déclencheur : l'explosion de l'IA générative, qui a fait de ces puces une ressource quasi-souveraine.

Nvidia, AMD et Intel se retrouvent donc dans une arène que personne n'avait vraiment anticipée sous cette forme. Chacun avec ses atouts, ses angles morts et ses ambitions. Le spectacle est fascinant, et loin d'être terminé.


Nvidia : le roi confortable sur son trône

Une domination qui ressemble à un monopole (presque)

Nvidia détient entre 70 et 85 % du marché des GPU dédiés à l'IA selon les estimations. C'est le genre de chiffre qui fait tiquer les régulateurs et sourire les actionnaires. L'architecture CUDA, développée depuis 2006, est le socle invisible de cet empire : des décennies d'optimisation logicielle que ses concurrents peinent à égaler.

La série H100, puis la H200, ont redessiné les standards du calcul IA. Les data centers du monde entier en font la liste au Père Noël avec une régularité touchante. Le Blackwell B200, présenté en 2024, promet des gains de performance notables pour l'entraînement des grands modèles de langage.

Ce qui rend Nvidia difficile à déloger à court terme, c'est moins la puce elle-même que l'écosystème qui l'entoure. NVLink, NVSwitch, les bibliothèques cuDNN, la plateforme Triton : autant d'éléments qui transforment un simple GPU en infrastructure complète. Changer de fournisseur ne revient pas à changer de voiture, mais à changer de ville.

Les failles dans l'armure

Jensen Huang sait que les empires durent seulement si l'on continue à mériter la couronne. Les tensions géopolitiques autour des exportations vers la Chine fragilisent une part non négligeable du chiffre d'affaires. Et la dépendance à TSMC pour la fabrication crée une vulnérabilité structurelle que la montée des tensions taïwanaises ne dissipe pas.


AMD : l'outsider sérieux

MI300X : la carte maîtresse

AMD a longtemps joué le rôle de l'éternel second. Avec ses puces Instinct MI300X, l'entreprise dirigée par Lisa Su a changé de registre. L'architecture CDNA 3 offre 192 Go de mémoire HBM3 sur une seule puce, contre 80 Go pour le H100.

Microsoft, Meta et plusieurs acteurs du cloud ont déjà intégré le MI300X dans leurs infrastructures. Ce n'est plus de la figuration. Pour les tâches d'inférence, où la bande passante mémoire prime sur la puissance brute de calcul, AMD grappille des parts de marché mesurables.

Le défi ROCm

Le talon d'Achille reste l'écosystème logiciel. ROCm, la plateforme open-source d'AMD, progresse, mais accuse encore un retard de maturité face à CUDA. Les développeurs qui ont passé des années à optimiser leur code pour Nvidia ne migrent pas par idéologie : il faut que le gain soit réel, mesurable, immédiat.

AMD investit massivement pour réduire cet écart. Des partenariats avec PyTorch et des efforts autour de la compatibilité HIP, qui permet de compiler du code CUDA pour les GPU AMD, montrent une stratégie logicielle enfin prise au sérieux. L'écart se réduit. Lentement, mais il se réduit.


Intel : le géant qui apprend à courir

Gaudi et la promesse du challenger

Intel arrive dans cette course avec un bagage paradoxal : la plus longue histoire dans les semi-conducteurs et pourtant la position la moins évidente sur le nouveau marché IA. Les puces Gaudi, désormais à la troisième génération avec le Gaudi 3, concentrent la stratégie offensive de l'entreprise sur l'accélération IA.

L'argument commercial d'Intel est lisible : un rapport performance/prix plus favorable pour les entreprises qui cherchent à déployer de l'IA sans aligner les budgets pharaoniques que demandent les GPU Nvidia. Des clients comme IBM et plusieurs fournisseurs cloud régionaux ont commencé à expérimenter. Ce n'est pas négligeable.

La réalité des ambitions

Intel traverse en parallèle une restructuration douloureuse : suppressions de postes, révision de la feuille de route des fonderies, pression des investisseurs. Cette turbulence interne pèse sur sa capacité à tenir une stratégie IA cohérente sur la durée.

Son vrai atout pourrait venir de ses fonderies en construction aux États-Unis et en Europe, alors que la souveraineté technologique est devenue une obsession politique. Si Intel parvient à s'installer comme le fournisseur de puces IA fabriquées localement, la donne pourrait changer, indépendamment des benchmarks.


Le vrai terrain de la bataille : l'écosystème logiciel

Pourquoi le hardware seul ne suffit pas

On l'oublie parfois dans la fascination pour les chiffres de TFLOPS et les nanomètres de gravure : une puce sans logiciel est un beau presse-papier. L'IA moderne se déploie via des frameworks, PyTorch, TensorFlow, JAX, eux-mêmes optimisés en couches successives pour certaines architectures matérielles.

CUDA bénéficie de deux décennies d'optimisations cumulées. Chaque mise à jour de PyTorch, chaque nouvelle version de cuDNN, renforce l'avantage de Nvidia. C'est l'effet flywheel du logiciel : plus les développeurs utilisent CUDA, plus les bibliothèques s'optimisent, plus les développeurs restent sur CUDA. Un cercle difficile à briser de l'extérieur.

Les nouveaux entrants qui compliquent le tableau

Au-delà du trio Nvidia-AMD-Intel, un écosystème de challengers s'organise. Groq avec son architecture LPU, Cerebras avec ses wafer-scale chips, les TPU de Google et les Trainium d'Amazon dessinent un marché beaucoup moins tripolaire qu'il n'y paraît.

Les grands hyperscalers développent leurs propres puces IA pour réduire leur dépendance à Nvidia. Cette verticalisation changera la structure du marché dans les cinq prochaines années ; personne ne sait encore dans quelle proportion.


Enjeux géopolitiques et souveraineté numérique

La puce comme arme diplomatique

Les restrictions d'exportation américaines sur les GPU avancés vers la Chine ont transformé le marché des semi-conducteurs en échiquier géopolitique. Nvidia a dû développer des versions bridées de ses puces, le H20 et l'A800, pour contourner les réglementations tout en maintenant une présence commerciale.

Pékin accélère ses investissements dans des alternatives nationales via Huawei et son Ascend 910B. Le marché mondial de l'IA hardware se fragmente selon des lignes géopolitiques plutôt que strictement commerciales, et cette tendance s'accélère.

L'Europe dans l'équation

L'Europe, fidèle à sa tradition d'arriver légèrement après la bataille, tente de construire une capacité propre via le Chips Act européen. Les résultats restent modestes à court terme, mais la prise de conscience politique est réelle. Elle crée des opportunités pour quiconque peut offrir une alternative crédible aux puces américaines.


Ce que 2025 et au-delà nous réserve

Le marché des GPU pour l'IA devrait dépasser les 100 milliards de dollars d'ici 2027 selon plusieurs analyses sectorielles. La croissance est structurelle : chaque nouveau modèle de langage demande davantage de puissance de calcul, et l'inférence en temps réel à l'échelle du grand public représente une demande encore à peine effleurée.

AMD continuera de ronger les parts de Nvidia sur l'inférence, Intel cherchera son créneau entre performance et prix, et Nvidia défendra son écosystème avec l'énergie de celui qui sait qu'il a tout à perdre. La vraie rupture viendra peut-être d'une architecture radicalement nouvelle, photonique, neuromorphique ou analogique, que personne ne maîtrise vraiment encore.

En attendant, Jensen Huang continue de porter sa veste en cuir, Lisa Su affine ses roadmaps, et Pat Gelsinger a quitté Intel fin 2024. Le marché des puces IA n'est jamais aussi vivant que lorsqu'il est imprévisible.