NVIDIA accélère avec Vera, mais la Chine ferme la porte au H200

Deux signaux contradictoires pour le roi du hardware IA

Le 26 mai 2026, NVIDIA a envoyé deux messages très différents au marché de l’intelligence artificielle. D’un côté, son nouveau processeur Vera CPU, conçu pour les charges de travail d’IA agentique, reçoit ses premiers résultats publics de benchmark avec des performances qui placent enfin NVIDIA dans une vraie confrontation CPU face à Intel et AMD. De l’autre, la Chine refuse toujours d’autoriser l’achat de puces H200, malgré l’ouverture réglementaire américaine et l’intervention personnelle de Donald Trump.

Le contraste est frappant : NVIDIA progresse techniquement vers une plateforme IA toujours plus intégrée, mais perd de la marge de manœuvre sur l’un des marchés les plus stratégiques du monde. La domination de l’entreprise n’est donc pas remise en cause par un concurrent unique, mais par deux forces opposées : l’excellence d’exécution côté silicium et la fragmentation politique côté commerce international.

Vera : le CPU que NVIDIA veut placer au cœur de l’IA agentique

Selon NVIDIA Blog, Vera est pensé pour une nouvelle catégorie de charge de travail : non plus seulement entraîner ou servir un modèle, mais faire tourner des milliers d’environnements logiciels, d’agents, d’appels d’outils, de sandboxes, de compilations et de tâches de coordination autour des GPU. C’est le point central de l’IA agentique : les modèles ne se contentent plus de répondre, ils planifient, exécutent du code, interrogent des bases de données, manipulent des fichiers et déclenchent des workflows.

Techniquement, Vera repose sur 88 cœurs Olympus conçus par NVIDIA, 176 threads grâce au Spatial Multithreading, une compatibilité Armv9.2, jusqu’à 1,2 TB/s de bande passante mémoire LPDDR5X et une interconnexion NVLink-C2C annoncée à 1,8 TB/s lorsqu’il est couplé aux GPU Rubin. NVIDIA le présente comme un processeur de centre de données, mais surtout comme un composant d’usine IA : son rôle est de maintenir les GPU alimentés, de réduire les goulots d’étranglement CPU et de rendre plus prévisibles les charges agentiques très parallèles.

Phoronix, média spécialisé Linux et hardware, a publié le premier regard indépendant significatif sur la plateforme. Ses résultats, repris par NVIDIA, indiquent que Vera dépasse largement Grace, l’ancien CPU Arm de NVIDIA, et se montre compétitif face à des processeurs x86 haut de gamme. NVIDIA met notamment en avant un gain géométrique de 1,6 fois face à Grace, un avantage global de 1,5 fois face à un processeur x86 récent à 128 cœurs, ainsi qu’un résultat supérieur de 10 % à celui d’un AMD EPYC 9575F dans la moyenne géométrique citée par Phoronix.

Il faut toutefois lire ces données avec prudence. Phoronix est une source technique crédible, mais ce premier périmètre de test est centré sur les usages que Vera vise précisément : compilation, Python, Java, bases de données, compression, transcodage et bande passante mémoire. NVIDIA Blog et NVIDIA Newsroom sont, eux, des sources primaires commerciales : utiles pour les spécifications et le positionnement, mais naturellement orientées vers les forces du produit. Une annonce d’entreprise n’est pas une validation indépendante complète.

Pourquoi le CPU redevient stratégique dans l’IA

Depuis deux ans, l’attention s’est presque entièrement concentrée sur les GPU : H100, H200, Blackwell, Rubin. Pourtant, l’IA agentique redonne de l’importance au CPU. Une application multi-agent ne passe pas tout son temps à multiplier des matrices. Elle orchestre des processus, lance des conteneurs, gère la mémoire, exécute du code, manipule du contexte, vérifie des règles et agrège des résultats.

Le billet d’AWS publié le 26 mai 2026 illustre très bien cette évolution. Amazon Web Services y décrit une architecture associant Strands Agents, NVIDIA NIM et Amazon Bedrock AgentCore pour créer un système multi-agent avec raisonnement parallèle, mémoire partagée, observabilité et inférence accélérée par GPU. AWS est également une source d’entreprise, donc promotionnelle, mais le cas d’usage est révélateur : les grands fournisseurs cloud ne vendent plus seulement des modèles, ils vendent une pile d’exécution complète pour agents.

Dans cette pile, Vera devient une pièce logique. Si l’inférence reste accélérée par GPU, le CPU devient le chef d’orchestre. Prime Intellect, qui collabore avec NVIDIA, affirme avoir testé Vera pour des sandboxes de reinforcement learning, avec une densité élevée de machines virtuelles et des gains de débit face à une base AMD Zen 5. Là encore, il s’agit d’un partenaire de NVIDIA, donc pas d’un audit neutre, mais cela confirme la direction du marché : l’IA agentique transforme le centre de données en système hétérogène où CPU, GPU, DPU, réseau et logiciel sont co-conçus.

La Chine refuse le H200 : un revers politique, pas technique

Pendant que Vera consolide l’histoire technique de NVIDIA, l’histoire commerciale en Chine se complique. TechRadar rapporte que la Chine n’a pas acheté de puces H200 malgré les efforts de Donald Trump. Bloomberg, cité par plusieurs médias, rapporte que Trump a déclaré que la Chine avait choisi de ne pas acheter, car elle voulait développer ses propres puces. Le South China Morning Post confirme également que la question du H200 a été abordée lors des échanges entre Trump et Xi Jinping, sans percée immédiate.

Le contexte réglementaire est important. En décembre 2025, selon Reuters, les États-Unis ont accepté d’autoriser l’exportation du H200 vers des clients chinois approuvés, avec une ponction de 25 % sur les ventes. En janvier 2026, le Bureau of Industry and Security du Département du commerce américain a officialisé une politique d’examen au cas par cas pour le H200, l’AMD MI325X et des puces similaires, sous conditions de sécurité, de disponibilité pour les clients américains et de tests indépendants.

Mais l’autorisation américaine ne suffit pas. Reuters avait déjà rapporté en janvier que des agents douaniers chinois avaient reçu l’instruction de ne pas laisser entrer les H200, et que des entreprises chinoises avaient été convoquées pour être dissuadées d’en acheter sauf nécessité particulière. NVIDIA elle-même, dans ses résultats du premier trimestre fiscal 2027, indique que ses perspectives pour le trimestre suivant ne supposent aucun revenu de calcul data center en Chine.

Autrement dit, le blocage s’est déplacé. Au départ, Washington empêchait NVIDIA de vendre ses accélérateurs avancés à la Chine. Désormais, Washington entrouvre la porte au H200, mais Pékin hésite ou refuse de l’emprunter. Le H200 devient moins un produit qu’un instrument de négociation industrielle.

Le pari chinois : perdre du temps pour gagner de l’autonomie

La position chinoise peut sembler coûteuse à court terme. Le H200 reste une puce puissante, bien plus performante que les versions bridées précédemment disponibles pour le marché chinois. Les géants locaux comme Alibaba, Tencent ou ByteDance auraient intérêt à accéder à du matériel NVIDIA pour rester compétitifs dans l’IA générative et l’inférence à grande échelle.

Mais Pékin raisonne sur une autre échelle de temps. Acheter du H200 sous licence américaine, avec inspection, conditions, taxes et risque de revirement politique, revient à construire son infrastructure IA sur une dépendance fragile. Refuser le H200 pousse au contraire les acteurs chinois vers Huawei, Cambricon, Baidu, Alibaba, Moore Threads et d’autres fournisseurs nationaux. Même si ces alternatives sont moins performantes aujourd’hui, elles renforcent l’écosystème local, les compilateurs, les bibliothèques, les interconnexions et les pratiques d’optimisation.

C’est le paradoxe des contrôles à l’exportation : ils freinent l’accès aux meilleures puces, mais accélèrent la volonté de substitution. Jensen Huang a d’ailleurs averti à plusieurs reprises que l’exclusion de NVIDIA du marché chinois pouvait réduire l’influence de l’écosystème CUDA au profit de piles logicielles locales.

Prospective : NVIDIA plus fort partout, sauf là où la politique décide

À court terme, Vera renforce la thèse d’investissement technologique de NVIDIA. L’entreprise ne vend plus seulement des GPU, mais une architecture complète : CPU Vera, GPU Rubin, NVLink, BlueField, Spectrum-X, NIM, Dynamo et un écosystème logiciel qui verrouille les centres de données IA. Si les benchmarks se confirment sur des charges variées et chez des clients indépendants, Vera pourrait devenir le premier CPU Arm réellement capable de bousculer l’hégémonie x86 dans les serveurs IA.

À moyen terme, le refus chinois du H200 signale toutefois que la domination technique ne garantit plus l’accès au marché. Dans un monde fragmenté, le meilleur accélérateur n’est pas nécessairement celui qui sera acheté. Les critères deviennent politiques : souveraineté, sécurité, contrôle de la chaîne d’approvisionnement, capacité de négociation et indépendance logicielle.

Le scénario le plus probable est donc une bifurcation. Dans les clouds occidentaux, chez les hyperscalers et dans les laboratoires d’IA de pointe, NVIDIA pourrait renforcer son avance grâce à Vera Rubin et à l’intégration verticale de sa plateforme. En Chine, l’entreprise risque de voir émerger un marché parallèle, moins performant mais plus autonome, où les fournisseurs domestiques progressent par nécessité.

C’est le vrai message de cette semaine : NVIDIA continue de gagner la course technologique, mais la course géopolitique ne se joue plus uniquement en téraoctets par seconde. Elle se joue dans les licences, les douanes, les politiques industrielles et la capacité des nations à accepter — ou refuser — une dépendance au silicium américain.