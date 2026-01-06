AIが安くなる？NVIDIAの六神合体チップ「Rubin」とは
もっと安く使えるようになれ〜。
NVIDIAがCES 2026で、CPU・GPUなど6つのチップを一体的に設計してデータセンターをAIスーパーコンピュータとして構成する新プラットフォームを発表しました。
その名も「Rubin」、ダークマターの存在を強く示した天文学者ヴェラ・ルービンにちなんでいます。
コンシューマ向けの製品ではないんですが、AIの処理速度やさせられる思考量などに影響しそうです。
利用費自体が下がるかは未知数ですが、回答が得られるまでの待ち時間や得られる回答の長さや質には影響しうる性質を持っています。
AI演算性能はアップ、学習・推論コストはダウン
同社によるとRubinは、現行世代のBlackwellより効率的。
演算性能とメモリ帯域が向上。
（とくにMoE推論で）トークン生成コストを最大10分の1に、MoE（mixture of experts）型モデルの学習で必要GPU数も最大で4分の1にできるそうです。
同社CEO ジェンスン・フアン氏は「Rubinは“ちょうどいいタイミング”でやってきた」と述べています。
AIデータセンター向けの需要が膨らんでおり、GPU用メモリなどがネックになりやすい状況だと思われます。
Rubinは「同じ効果をより少ないGPUで」という設計なので、メモリ逼迫を緩和できる可能性はありそうではあります。
AI企業から「Rubinを活かした製品」が出るが、PCとかではない
Rubinがさまざまな問題を実際に解消できるかはもちろん未知数。
「Rubin関連の製品は2026年後半にパートナー企業から提供される」と述べられていて、実際に登場してくれないと影響も何もわからない、という状態です。
パートナーとして名前が挙がったのは、Amazon Web Services（AWS）やGoogle、Microsoft、Oracleなどのクラウド事業者、AnthropicやOpenAI、xAIなどのAIラボ／サービス企業、そしてサーバーメーカーなど。
それを踏まえると、クラウドのRubin搭載GPUインスタンスやデータセンター向けのラック／サーバーとしてまず展開され、その上で各社が学習・推論サービスを提供、といった感じになるのではないかと思われます。
ストレージも重要になってきてるらしい
併せて、「AIネイティブストレージ」というものも導入されるそうです。
GPUメモリだけでは抱えにくいコンテキストを外部に逃がし、必要に応じて再利用・共有することで、長い文脈の推論を回しやすくするための仕組みです。
NVIDIAのディオン・ハリス氏は「ボトルネックは演算からコンテキスト管理へ移りつつある」と述べています。
Source: NVIDIA, Gizmodo US