Technologie
Nvidia semble retarder la livraison de ses GPU Blackwell jusqu’au premier trimestre de 2025, en raison de la complexité de la technologie d’emballage chip-on-wafer-on-substrate (CoWoS) utilisée par TSMC pour fabriquer ce matériel de nouvelle génération.
Récemment, le géant des GPU a informé Microsoft des retards touchant les modèles les plus avancés de la famille Blackwell, selon des sources. Nous avons sollicité une confirmation de la part de Nvidia.
Ces retards pourraient entraîner un décalage de trois mois ou plus pour les expéditions en volume de puces comme la Blackwell B200, perturbant ainsi les plans de clients tels que Microsoft et Meta, qui auraient passé des commandes s’élevant à plusieurs milliards de dollars pour ces nouveaux GPU destinés à alimenter leurs services d’IA.
Cela pourrait également contraindre Nvidia à annuler ou à reporter certains produits afin de concentrer l’approvisionnement en silicium sur ceux jugés prioritaires.
Les retards dans les expéditions de GPU sont principalement liés à la conception physique de la famille Blackwell, selon un rapport de la société de recherche en semi-conducteurs SemiAnalysis. En effet, Blackwell est le premier design à volume élevé à utiliser la technologie d’emballage CoWoS-L de TSMC, le fabricant de puces de Nvidia.
La technologie CoWoS permet de concevoir des produits plus complexes et avancés en utilisant des chiplets interconnectés, généralement un système sur puce (SoC) et un ou plusieurs chiplets de mémoire à large bande passante (HBM).
Cependant, CoWoS-L présente un niveau de complexité bien supérieur à celui de CoWoS-S, où les chiplets sont montés sur un interposeur en silicium relativement simple. CoWoS-L utilise plutôt un interposeur organique qui sert de couche de redistribution (RDL) pour acheminer les signaux entre les chiplets, en utilisant des interconnexions en silicium local (LSIs) et des dies de pont intégrés dans l’interposeur.
Selon SemiAnalysis, un interposeur organique est nécessaire pour agrandir les paquets CoWoS au-delà du GPU MI300 d’AMD, car le silicium est fragile et la manipulation d’interposeurs en silicium très fins devient plus difficile à mesure qu’ils grandissent. Les LSIs et les dies de pont aident à compenser la performance électrique inférieure de l’interposeur organique.
Cependant, plusieurs problèmes ont été identifiés avec cette technologie. L’un d’eux est que l’intégration de plusieurs ponts en silicium dans l’interposeur peut provoquer un décalage de dilatation thermique entre les dies en silicium, les ponts, l’interposeur organique et le substrat, entraînant une déformation du substrat qui peut rompre les connexions.
Les principales causes des retards sont les dies de pont, qui nécessiteraient une nouvelle conception, ainsi qu’une refonte des couches métalliques de routage global et des connexions du die Blackwell lui-même.
De plus, TSMC ne dispose pas d’une capacité d’emballage CoWoS suffisante pour répondre à la demande, comme cela a été rapporté à plusieurs reprises. TSMC a développé sa capacité CoWoS-S ces dernières années principalement pour servir Nvidia, mais maintenant, le fabricant de GPU passe à CoWoS-L, selon SemiAnalysis.
Bien que TSMC construise une nouvelle usine pour la production de CoWoS-L, le fabricant de semi-conducteurs doit de toute urgence convertir sa capacité CoWoS-S existante pour pouvoir répondre à la demande.
En attendant, Nvidia doit faire des choix sur l’utilisation de l’approvisionnement disponible de TSMC. Par conséquent, SemiAnalysis estime que l’entreprise se concentre presque entièrement sur les systèmes à échelle rack GB200 NVL36/72, et que les formats HGX avec les B100 et B200 sont « effectivement en cours d’annulation, sauf pour quelques volumes initiaux ».
Pour répondre à la demande, Nvidia lancera également un GPU Blackwell appelé B200A, basé sur le die B102, qui est également destiné au GPU B20 « spécial Chine » de Nvidia. Ce B102 est un die monolithique unique avec 4 empilements de HBM, permettant au chip d’être emballé sur CoWoS-S au lieu de CoWoS-L, selon SemiAnalysis.
Tout cela ne devrait pas trop nuire à Nvidia. Selon le site d’actualités financières Barron’s, le fabricant de GPU pourrait voir quelques milliards de dollars de revenus arriver au début de 2025 au lieu de la fin de 2024, mais les clients ne parviennent toujours pas à obtenir tous les puces Hopper qu’ils souhaitent, donc l’entreprise pourrait simplement produire davantage de celles-ci.
Cependant, Nvidia pourrait faire face à d’autres problèmes avec le B20. D’après un rapport du South China Morning Post, Washington envisage de renforcer encore les restrictions à l’exportation, ce qui empêcherait la vente de ce nouveau GPU en Chine, son marché cible.
À la fin de l’année dernière, la secrétaire au Commerce, Gina Raimondo, a averti que les États-Unis devraient continuer à renforcer les restrictions pour éviter que leurs contrôles d’exportation sur les puces capables d’IA ne soient contournés.
« Si vous redessinez une puce autour d’une ligne de coupe particulière qui lui permet de faire de l’IA, je vais la contrôler le jour suivant », a-t-elle déclaré à l’époque.
Un porte-parole de Nvidia n’a pas démenti les rapports, mais a déclaré à un média : « Comme nous l’avons déjà dit, la demande pour Hopper est très forte, l’échantillonnage large de Blackwell a commencé, et la production est sur la bonne voie pour augmenter au second semestre. Au-delà de cela, nous ne commentons pas les rumeurs. »
Nous notons qu’en mars, Nvidia nous avait informés que les processeurs Blackwell commenceraient à être expédiés au second semestre de cette année, bien qu’il ait été vague sur le calendrier – et il l’est toujours. Cette augmentation de production « sur la bonne voie » cette année pourrait encore signifier qu’il mettra sur le marché des puces de manière significative plus tard que prévu par l’industrie, en 2025, comme l’ont affirmé les rapports précédents.
Blackwell pourrait bien être retardé comme le laissent entendre les rumeurs, mais d’un autre côté, Nvidia n’a pas été particulièrement transparent sur le moment où le silicium serait disponible de toute façon.