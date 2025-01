中国のAI企業・DeepSeekが2025年1月20日にリリースした推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」は、OpenAIの推論モデル・o1相当の性能でありながらo1と比べてトレーニングコストが非常に低いことや、MITライセンスの下でオープンソース化されていることが特徴です。AIテクノロジー企業のLagoが、「なぜDeepSeekは自社のAIモデルをオープンソース化したのか」について解説しています。

???? Bonus: Open-Source Distilled Models!



???? Distilled from DeepSeek-R1, 6 small models fully open-sourced

???? 32B & 70B models on par with OpenAI-o1-mini

???? Empowering the open-source community



???? Pushing the boundaries of **open AI**!



???? 2/n pic.twitter.com/tfXLM2xtZZ— DeepSeek (@deepseek_ai) January 20, 2025

Lago Blog - Why DeepSeek had to be open-source (and why it won't defeat OpenAI)https://www.getlago.com/blog/deepseek-open-sourceDeepSeekが2025年1月20日にリリースしたDeepSeek-R1は、o1と比較してトレーニングコストがわずか4%程度でありながらo1と同等かそれ以上の性能を発揮することが報告されています。この結果に対してLagoは「彼らは、OpenAIやAnthropic、およびその他の資金力のある競合他社が独自のモデルのトレーニングに使用しているよりも効率的な新しいトレーニング方法でこの成果を達成しました」と述べる一方「コカ・コーラがレシピをオープンソース化していないように、市場をリードする革新的な製品はその利点を活用すべきです。なぜDeepSeekはDeepSeek-R1をオープンソース化したのでしょうか」と語りました。Lagoによると、DeepSeekがAIモデルをオープンソース化した理由は、DeepSeekが中国企業であるためとのこと。実際にアメリカでは中国を含む敵対国によってAI関連アプリケーションが軍事転用されるという懸念から、中国へのAIチップの輸出規制を行っています。こうした要因から、DeepSeek-R1も欧米市場では懐疑的な目を向けられたり、利用に不安視されたりすることは避けられません。そこでDeepSeekはAIモデルをオープンソース化することで、ユーザーならびに開発者からの信用を得ようとしているというわけです。Lagoはこうしたモデルのオープンソース化について「オープンソース化は単なる技術的な行動ではなく、市場での足場を固めるための文化的な行動でもある」と述べています。また、アメリカによる高性能AIチップの輸出規制の影響を受けるDeepSeekは、少ないリソースを使って最大限の結果を残さなければなりません。そのため、DeepSeekはモデルをより効率的にトレーニングする方法を見つける必要がありました。DeepSeekはどのようにしてOpenAIの3%のコストでo1を超えたのか? - GIGAZINE一方、OpenAIやMeta、Googleなどの豊富な資金やコンピューティングリソース、世界最大クラスのディストリビューションを持っている企業は、モデルをトレーニングするための効率的な方法を見つける必要はなく、資金を投入してモデルを構築することが可能です。また、大規模言語モデルをより簡単かつ安価に構築することは、これらの企業が持つ豊富な資金などのアドバンテージを失うことにつながります。加えて、近年ではGPT-4レベルの大規模言語モデルが次々とリリースされています。このような状況でOpenAIには、「オープンソースで利用できるモデルと比較して、OpenAI APIに多額の料金を支払う価値があるかどうか」というユーザーからの課題がのしかかっています。Lagoは「実際に自分が使っているAIアプリはLLaMa、GPT、Claude、Mistralのどれを使っているのか分かりません。エンドユーザーが違いを知らないのに、なぜOpenAI APIなどに多く支払わなければならないのでしょうか」と指摘しています。また、オープンソースのソフトウェアは低コストでカスタマイズ性が高い反面、メンテナンスや技術的な知識が必要になります。一方、プロプライエタリソフトウェアはスムーズに使用することが可能ですが、柔軟性に欠けるとのこと。そのため、インフラは常にカスタマイズが必要であり、エンジニアがコードを監査・修正できるオープンソースのデータベースが近年では人気を集めています。同じことは大規模言語モデルでも言え、AI製品の開発は高度なカスタマイズが不可欠であるため、o1をはじめとするプロプライエタリなモデルよりもDeepSeek-R1のようなオープンソースモデルが適しています。Lagoは「インフラストラクチャでは、最終的にはオープンソースが勝利します」と述べました。しかし、LagoによるとAI業界をリードしてきたOpenAIがこのまま時代遅れになるという見通しは甘いとのこと。OpenAIはGPT-4やo1など、その他のAIモデルの基礎となるさまざまなAI製品を開発しており、OpenAIのサム・アルトマンCEOは「DeepSeekのR1は、特に価格に見合った機能を提供している点で、印象的なモデルです。明らかに、私たちはR1より優れたモデルをお届けすることができるし、新しい競争相手がいるというのは本当に刺激的なことです!今後、いくつかのリリースを発表予定です」と伝えています。OpenAIのサム・アルトマンCEOが「DeepSeek-R1はスゴイけど、もっとスゴイAIモデルを発表予定」と発言 - GIGAZINEそれでもLagoは「DeepSeek-R1は資金力のある既存のAI企業の目を覚まさせ、より効率的なトレーニング方法を見つけるように促すかもしれません」と語りました。