Groq 2.0 : après le quasi-rachat par Nvidia, le matériel ne suffit plus

Ce qui vient de se passer

Groq, l’une des jeunes pousses les plus visibles dans les puces d’intelligence artificielle, serait en train de lever jusqu’à 650 millions de dollars auprès de ses investisseurs existants. L’information vient d’Axios, puis a été reprise par TechCrunch et par Reuters. Point important : à ce stade, Groq n’a pas annoncé officiellement cette ronde, et les reprises médiatiques s’appuient essentiellement sur le scoop d’Axios. Il faut donc parler d’un financement rapporté, non d’un financement confirmé.

Le contexte rend toutefois cette opération beaucoup plus intéressante qu’une simple levée de fonds. En décembre 2025, Groq et Nvidia ont conclu un accord présenté officiellement comme une licence non exclusive de technologie d’inférence. Groq a annoncé que son fondateur Jonathan Ross, son président Sunny Madra et d’autres membres de l’équipe rejoindraient Nvidia, tout en précisant que Groq continuerait d’exister comme entreprise indépendante. Nvidia, de son côté, a détaillé dans ses documents déposés à la SEC une transaction sans achat d’actions, sans contrats clients ni produits existants acquis, mais avec une licence sur la technologie LPU de Groq et l’embauche de certains employés.

C’est là que le terme de « not-acqui-hire » utilisé par TechCrunch prend tout son sens : ce n’est pas une acquisition classique, mais cela en a plusieurs effets économiques. Nvidia obtient la technologie, le talent et une place dans le futur de l’inférence à très faible latence. Groq, lui, conserve une coquille opérationnelle, mais son centre de gravité semble se déplacer du matériel vers un service d’inférence dans le nuage.

Le vrai chiffre de l’accord Nvidia-Groq

La presse a largement évoqué un accord d’environ 20 milliards de dollars. Les documents financiers de Nvidia donnent une lecture plus précise : 13 milliards de dollars payés à la clôture, environ 4 milliards de dollars payables dans l’année, 14,4 milliards de dollars inscrits en goodwill et 2,5 milliards de dollars en actif incorporel lié à une technologie développée. Autrement dit, même si l’étiquette médiatique de 20 milliards reste utile pour saisir l’ordre de grandeur, le dépôt réglementaire montre une structure comptable particulière et un montant de contrepartie plus proche de 17 milliards de dollars.

Cette différence n’est pas un détail. Elle révèle une nouvelle grammaire des mégatransactions en IA : plutôt que d’acheter toute l’entreprise, une société dominante peut signer une licence très large, absorber une partie critique des talents, payer les investisseurs et limiter les risques réglementaires associés à une fusion complète. La FTC américaine a déjà signalé, dans ses travaux sur les partenariats entre grands fournisseurs de nuage et développeurs d’IA, que ces structures hybrides peuvent affecter l’accès aux intrants clés, aux talents et aux capacités de calcul. L’accord Nvidia-Groq s’inscrit exactement dans cette zone grise.

Pourquoi Groq change de cap

Groq n’était pas n’importe quel challenger. Fondée en 2016, l’entreprise s’est positionnée très tôt sur l’inférence, c’est-à-dire l’exécution de modèles déjà entraînés pour répondre aux requêtes des utilisateurs. Son pari reposait sur le LPU, ou Language Processing Unit, une architecture conçue pour réduire la latence et augmenter le débit de génération de jetons. En 2024, Groq avait levé 640 millions de dollars à une valorisation de 2,8 milliards, puis 750 millions en septembre 2025 à une valorisation post-money de 6,9 milliards, selon ses propres communiqués.

Mais concevoir une puce compétitive ne suffit pas. Il faut financer la fabrication, sécuriser une capacité de fonderie, bâtir des cartes, des serveurs, des racks, une chaîne logicielle, un réseau commercial, du support entreprise, et convaincre des clients de parier contre l’écosystème CUDA de Nvidia. La difficulté n’est pas seulement technologique : elle est industrielle et commerciale.

Le virage rapporté par Axios vers un « neocloud » d’inférence est donc logique. Plutôt que de vendre une puce frontalement contre Nvidia, Groq 2.0 chercherait à vendre un service : une capacité d’inférence rapide, hébergée, facturée aux développeurs et aux entreprises. C’est un modèle plus proche de CoreWeave, Lambda ou d’autres fournisseurs spécialisés que d’un pur fabricant de semi-conducteurs.

L’inférence devient le champ de bataille

Pendant la première phase de l’IA générative, l’attention s’est portée sur l’entraînement : construire les plus grands modèles, absorber des corpus gigantesques, empiler des GPU et réduire le temps de calcul. Mais la prochaine phase économique se joue dans l’inférence. Chaque interaction avec un assistant, chaque agent qui appelle des outils, chaque résumé, chaque recherche augmentée et chaque génération multimodale consomment du calcul à répétition.

Deloitte estime que les charges d’inférence pourraient représenter environ les deux tiers du calcul IA en 2026, contre environ la moitié en 2025. McKinsey anticipe aussi que l’inférence dépassera l’entraînement comme charge dominante dans les centres de données IA d’ici 2030. Ces projections ne sont pas neutres : elles expliquent pourquoi Nvidia, déjà dominant dans l’entraînement, ne peut pas laisser l’inférence devenir un espace où d’autres architectures s’imposeraient.

Les chiffres récents de Nvidia illustrent la puissance de cette position. Pour son premier trimestre fiscal 2027, l’entreprise a annoncé 81,6 milliards de dollars de revenus, dont 75,2 milliards pour les centres de données. Cette échelle financière donne à Nvidia un avantage massif : elle peut investir dans les puces, les interconnexions, les logiciels, les bibliothèques, les modèles, les partenariats et les acquisitions déguisées en licences.

Le matériel seul ne suffit plus

Le cas Groq montre que la bataille des puces IA n’est plus seulement une bataille de silicium. Même une architecture brillante doit s’intégrer dans un écosystème complet. Les billets récents de Nvidia Developer sur l’automatisation de la documentation de modèles avec le MCG Toolkit et sur l’exécution de modèles multimodaux Step 3.7 Flash sur GPU Nvidia ne prouvent évidemment pas la supériorité de Nvidia de façon indépendante : ce sont des publications d’entreprise, avec le biais naturel d’un fournisseur qui promeut sa plateforme. Mais elles rappellent une réalité stratégique : Nvidia vend un environnement, pas seulement des processeurs.

C’est aussi ce que l’on voit au-delà de Groq. MonCarnet rapportait récemment qu’Apple préparerait une évolution de Siri en s’appuyant sur Google et Nvidia, autre signe de l’enchevêtrement croissant entre modèles, infrastructure et fournisseurs de calcul. Même les géants qui conçoivent leurs propres puces restent souvent connectés à l’écosystème Nvidia lorsqu’il faut entraîner, tester ou déployer à grande échelle.

Dans ce contexte, Groq peut difficilement rester un fabricant de puces indépendant au sens traditionnel. Le coût de rivaliser avec Nvidia sur toute la chaîne est trop élevé. Le pivot vers l’inférence en nuage permet de transformer une faiblesse — l’absence d’un écosystème aussi vaste — en proposition plus ciblée : offrir de la latence, du débit et un coût prévisible pour des usages précis.

Une consolidation qui avance masquée

L’accord Nvidia-Groq pourrait devenir un modèle. Axios le suggère explicitement : investisseurs payés, talents redéployés, technologie licenciée, entreprise résiduelle recapitalisée. Pour les fonds de capital-risque, c’est attrayant. Pour les régulateurs, c’est plus complexe. Pour le marché, c’est ambigu.

D’un côté, Groq reste vivant. Si la nouvelle entité parvient à bâtir un nuage d’inférence performant, elle pourrait offrir une alternative utile aux entreprises qui ne veulent pas dépendre entièrement des grands hyperscalers. De l’autre, le cœur technologique et humain du challenger a été partiellement capté par Nvidia. La concurrence ne disparaît pas juridiquement, mais elle se réorganise autour du leader.

C’est le paradoxe du moment IA : il n’y a jamais eu autant de demande pour des alternatives à Nvidia, mais il n’a jamais été aussi difficile d’en construire une. Les besoins explosent, les clients cherchent de la capacité, les modèles exigent une latence plus faible, et pourtant la profondeur de l’écosystème Nvidia attire les partenaires, les développeurs et maintenant les technologies concurrentes.

Ce que cela signifie pour la suite

Si la levée de 650 millions se confirme, Groq 2.0 ne sera pas simplement une startup ressuscitée. Ce sera un test de marché : peut-on bâtir un fournisseur d’inférence crédible après avoir cédé une partie décisive de sa technologie et de ses dirigeants au champion du secteur ?

La réponse dépendra de trois facteurs. D’abord, la capacité de Groq à conserver ou reconstruire une différenciation technique réelle. Ensuite, sa capacité à vendre un service simple aux développeurs, sans leur demander de réécrire toute leur pile. Enfin, sa capacité à se financer durablement dans un marché où les dépenses d’infrastructure se chiffrent en milliards.

Pour Nvidia, l’opération est plus défensive qu’elle n’en a l’air. Elle verrouille un pan stratégique de l’inférence avant qu’il ne devienne le principal centre de profit de l’IA. Pour Groq, c’est une retraite tactique hors du duel frontal dans les puces. Pour le marché, c’est un avertissement : la consolidation des semi-conducteurs IA ne ressemblera pas toujours à une acquisition annoncée en grande pompe. Elle passera de plus en plus par des licences, des embauches ciblées, des investissements croisés et des entreprises qui survivent, mais changent de nature.