NVIDIAが開発中のAIチップ「B100」ならびに「B200」は2024年3月の発表当初、「2024年後半に入手可能」とアナウンスされていました。しかしその後、設計上の欠陥が見つかったことから、製造が遅延していることが報じられています。AIチップの製造の遅れに関してNVIDIAのジェンスン・フアンCEOが「100%NVIDIAが悪い」と認め、改良版のAIチップを準備中であることを明らかにしました。

Nvidia's design flaw with Blackwell AI chips now fixed, CEO says | Reuters

https://www.reuters.com/technology/artificial-intelligence/nvidias-design-flaw-with-blackwell-ai-chips-now-fixed-ceo-says-2024-10-23/



Nvidia's Jensen Huang admits AI chip design flaw was '100% Nvidia's fault' - TSMC not to blame, now-fixed Blackwell chips are in production | Tom's Hardware

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidias-jensen-huang-admits-ai-chip-design-flaw-was-100-percent-nvidias-fault-tsmc-not-to-blame-now-fixed-blackwell-chips-are-in-production

B100およびB200はNVIDIAの新たなGPUアーキテクチャ「Blackwell」が採用される初めてのAIチップで、2024年3月の技術カンファレンス「GTC 2024」にてBlackwellと同時に発表されました。

NVIDIAが数兆パラメータ規模のAIモデルを実現するGPUアーキテクチャ「Blackwell」と新GPU「B200」を発表 - GIGAZINE



発表当初、NVIDIAは「B100とB200のリリースは2024年後半」と伝えていましたが、その後、製造プロセスで設計上の欠陥が発見され、これらのAIチップの出荷が遅れることが報じられました。

NVIDIAの新型AIチップの製造が少なくとも3カ月遅延する見込みであることがリークされる - GIGAZINE



海外メディアのTom's Hardwareによると、B100およびB200ではGPUチップレットやLSIブリッジ、RDLインターポーザー、マザーボード基板の間に熱膨張特性の不一致があり、その結果システムが反り返って故障につながりやすくなっているとのこと。

出荷の遅れに関する報道が出されてから、一部のメディアは「出荷の遅れはNVIDIAの生産パートナーであるTSMCが原因で、NVIDIAとTSMCの間に緊張が高まっている」と伝えています。

こうした報道に対し、フアン氏は「Blackwellを採用したチップには設計上の欠陥があり、この結果出荷が遅れています。これは100%NVIDIAのせいです」と述べ、「出荷の遅れはTSMCが原因」とする説を「フェイクニュース」と述べ一蹴しました。



フアン氏によると、設計上の欠陥を修正するために、NVIDIAは7種類のチップをゼロから再設計し、同時に修正済みのAIチップの生産を開始する必要があったとのこと。こうしたプロセスの中で、「TSMCはBlackwell採用チップの製造を信じられないほどのペースで再開するのをサポートしてくれました」とフアン氏は述べています。

Tom's Hardwareは「一般的に問題の特定、修正、再設計したチップの作成にはそれぞれ3カ月程度を要します。NVIDIAとTSMCがB100およびB200の問題を修正して再生産を開始したスピードは驚異的です」と評しました。