AIにおいてオープンソースというと、一般的には透明性が高く、安価で運営されているイメージがあります。が、その「安価」が本当に安いのかは、すぐにはわからないのかもしれません。

オープンソース型AIは、長期的に見るとコスト高であるという研究調査が公開されています。

調査を行なったのは、AI研究＆リサーチ団体のNous Research。Google（グーグル）やOpenAIなどのクローズ型のAIモデルと、DeepSeekやMagistralなどのオープンソース型のAIモデル複数を対象に調査しました。

それぞれのモデルにまったく同じタスクを、3つのカテゴリ（基本的な知識・数学・ロジックパズル）で出題。解答にどれほどの労力を必要とするのかを調べました。ここでいう労力は、解答に必要な処理をしたトークンの数としました。

その結果、オープン型はクローズ型の1.5倍から4倍、基本的知識の問題では最大10倍ものトークンを使用したことがわかりました。トークン毎のコストが低くとも、トークン数が多くなることで、タスク1つあたりのコストは高くなる可能性があるのです。

トークン効率の重要性

AIの世界において、トークンとはテキストやデータの一片を意味します。AIが人間の言葉を理解（処理）する言葉・データの最小単位のことで、1つの単語だったり、単語の一部だったり、ときには句読点1つだったりもします。

クローズ型のAIは、AIモデルがどのようにトークン化し処理するのかは明らかにされていません。が、AIモデルは、人間がオーダーした文章をトークン化して処理するので、トークン数＝AIの仕事量・労力の値といっていいでしょう。ゆえに、AIモデルサブスクでは、プランに応じてトークン数に制限が設けられていることが多いのです。

Nous Researchの調査では、クローズ型よりも、一貫してオープン型の方が同タスクで処理するトークン数が多いことがわかりました。

一見オープン型という低価格が魅力に見えても、使えば使うほど、難しいタスクを頼めば頼むほど、トークン数が積み上がり、結果処理コストは大きくなってしまうということです。つまり、長期的には高コストになる可能性があるよというお話。

ちなみに、今回調査したオープンソース型AIモデルで最も非効率だったのは、Magistralのモデル。逆にオープン型でも比較的効率的だったのはlama-3.3-nemotron-super-49b-v1モデル。クローズ型では、OpenAIのモデルが最も効率的、とくに数学の問題での効率の高さが突出していました。

Source: Nous Research