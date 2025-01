2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約3%程度だとも伝えられたために、AIの開発に対する業界の見方を大きく変えたこのモデルについて、Apple、Microsoft、Automatticでの勤務経験があるアナリストのベン・トンプソン氏が解説しました。

DeepSeek FAQ - Stratechery by Ben Thompsonhttps://stratechery.com/2025/deepseek-faq/17 Thoughts About the Big DeepSeek Selloff - Bloomberghttps://www.bloomberg.com/news/newsletters/2025-01-27/17-thoughts-about-the-big-deepseek-selloff「R1」はMixture of Experts(MoE)アーキテクチャを採用したAIモデル「DeepSeek-V3-Base」に基づいてトレーニングされており、総パラメータ数は6710億、コンテキスト長は128Kです。推論能力を持ち、特にコーディング、数学、ロジックといった分野では、より質の高い結果を生み出すことがわかっています。DeepSeekはApp Storeのアプリランキングで1位に躍り出るなど、登場以来瞬く間に人気を集めました。DeepSeekの優れている点の1つは、オープンソースで公開されているということです。ライバルでクローズドモデルのOpenAIの「o1」とは違い、提供元にお金を払わなくとも好きなサーバーやローカル上で実行することができます。DeepSeekをオープンソースで公開したことについて、CEOのLiang Wenfeng氏は「オープンソースは人材を惹きつける鍵です。時代を変えるテクノロジーにおいてクローズドソースによって作られた塀は一時的なものであり、OpenAIのクローズドソースのアプローチでさえ、他社の追い上げを防ぐことはできませんでした。私たちは、DeepSeekを通じてノウハウを蓄積し、イノベーションを起こせる組織と文化を形成します。オープンソースは商業的なものというよりも文化的な行動であり、それに貢献することで私たちは尊敬を集められます。今後クローズドソースに変更することはありませんし、まず強力な技術的エコシステムを持つことがより重要だと考えています」と述べています。DeepSeekのもう1つの優れた点は、AI開発におけるブレークスルーを達成した点です。これまでの一般的な大規模言語モデルは、人間の価値観に沿うように人間がモデルのトレーニングを繰り返す「人間のフィードバックによる強化学習(RLHF)」という手法でトレーニングされ、出力内容に有害なものが生じないよう調整されてきました。ところが、DeepSeekの「R1-Zero」の方は人間によるフィードバックを削除し、ほとんどの過程で強化学習(RL)のみに基づいたアプローチでトレーニングを行っています。DeepSeekの開発者らによると、「正解」と、「思考プロセスを利用した適切な形式」の2つに対して報酬関数を設定し、段階的に評価しようとしたり可能性のあるすべての答えを検索したりするのではなく、一度に複数の異なる答えを出してから報酬関数に基づく評価を行うようモデルに指示したとのこと。トンプソン氏は「つまり、推論の仕方を人間が教えずとも、十分な計算量とデータを与えればAIが勝手に推論してくれるという状態を実現したのです」と解説しています。このアプローチによりモデルは思考時間により多くの時間を割り当てることが可能になり、予期せぬ能力が開花しました。これは、従来のデータセットを使い果たすことで学習のスケーリングが限界に近づくという既存のモデルの問題を解決する可能性があります。DeepSeekはどのようにしてOpenAIの3%のコストでo1を超えたのか? - GIGAZINE3つ目の優れた点が、少ないコストで開発されたという点です。OpenAIなどがトレーニングに数十億ドル(数千億円)を費やしていると言われる中、このモデルは600万ドル(約9億3000万円)未満のコストしかかからなかったとされており、またアメリカの半導体輸出規制の中で性能を落として輸出されたNVIDIA製半導体で開発を実現したという点が注目すべきポイントです。低性能の機器でも高性能の機器に勝るモデルを開発できたという事実により、半導体企業のNVIDIAの価値が揺らいで株価が一時下落しましたが、いずれにせよDeepSeekがNVIDIAの製品に頼ったということに変わりはなく、トンプソン氏は「まだNVIDIAは有利」との見方を示しています。一方で投資家は頭を悩ませることになります。大企業が多額の費用を投じて進歩を夢見た分野に突然安価でフリーな代替品が現れれば、産業が混乱します。NVIDIA株の下落や、「AIの開発にはエネルギーが必要」との観点から買われていたエネルギー企業の売り転換は、混乱する投資家らの内情がよく反映されていると言えます。海外メディアのAxiosはこの点を「既存の企業に全賭けしたベンチャーキャピタルにとって絶滅レベルの出来事だ」と表現しました。ただし、DeepSeekが機器の効率的な使用方法を発見したからといって少数の機器で十分だというわけではなく、少なくともNVIDIAの需要はまだ続くことになります。一方でNVIDIA以外の製品で開発することの利点が発見されるなどすれば、そのの地位は揺らぎかねません。トンプソン氏は「DeepSeekは皆に大きな贈り物を提供したと思います。最大の勝者は消費者と企業であり、長期的にはAIを利用するすべての人が最大の勝者となるでしょう。中国もまた大きな勝者であり、DeepSeekの成功でイノベーションがさらに解き放たれるはずです」と述べました。