ChatGPTを開発・運営するOpenAIが新たなモデルのAPI経由での提供を開始するほか、API使用量管理ツールの更新や、GPT-3.5 Turboの価格引き下げなどAPI関連のアップデートを発表しました。

New embedding models and API updates

https://openai.com/blog/new-embedding-models-and-api-updates



◆新たな埋め込みモデルが登場

「埋め込み」とは、テキストやコードなどコンテンツ内の概念を表す一連の数字のこと。数値化することで、機械学習モデルなどのアルゴリズムがコンテンツ間の関係性を理解し、関連コンテンツをまとめる「クラスタリング」や検索などのタスクを行いやすくできます。



今回の発表では、従来は1モデルだけだった埋め込みモデルが小型と大型に分かれ、小型で高効率の「text-embedding-3-small」モデルおよび大規模かつ強力な「text-embedding-3-large」モデルが登場しました。

小型モデルの方は従来の「text-embedding-ada-002」モデルに比べて多言語検索で一般的に使用されるベンチマークであるMIRACLの平均スコアを31.4%から44.0%に増加させるなどの性能向上を実現しながら、同時に価格を5分の1である1000トークン当たり0.00002ドル(約0.003円)まで低廉化させることに成功しています。

一方大型モデルの方は作成する埋め込みの次元数が3072まで増加しており、MIRACLの平均スコアで54.9%を記録するなど高性能なモデルとのこと。価格は従来の1.3倍である1000トークン当たり0.00013ドル(約0.02円)となっています。

モデル料金text-embedding-3-small$0.00002 / 1K tokenstext-embedding-3-large$0.00013 / 1K tokensada v2$0.00010 / 1K tokens

さらに、text-embedding-3の両モデルは埋め込みの次元数を削減してストレージやメモリの使用量を削減する機能に対応しました。英語タスクで一般的に使用されるベンチマークのMTEBのいくつかの次元数におけるスコアは下表のとおり。小型モデルは最大1536次元まで、大型モデルは最大3072次元までの埋め込みを作成することが可能です。

 ada v2text-embedding-3-smalltext-embedding-3-large埋め込みサイズ1536512153625610243072平均MTEBスコア61.061.662.362.064.164.6

なお、従来モデルのtext-embedding-ada-002を廃止する予定はないため、「新しいモデルの使用を推奨する」と書かれていますが従来モデルも引き続き利用可能とのことです。

◆GPT-3.5 Turboモデルのアップデート

GPT-3.5 Turboのモデルが1週間以内を目安に更新され、「gpt-3.5-turbo-0125」となる予定です。同時にこの1年間で3回目となる価格の引き下げを行い、入力価格は従来の半額である1000トークン当たり0.0005ドル(約0.074円)、出力価格は25%安価な1000トークン当たり0.0015ドル(約0.22円)になります。価格が低下しただけでなく、応答精度の向上やテキストエンコードの問題修正などさまざまな改善が行われていると述べられています。

◆GPT-4 Turboのプレビューをアップデート

GPT-4 Turboの新たなプレビューモデル「gpt-4-0125-preview」が発表と同時にリリースされました。2023年12月頃から「GPT-4がタスクを完遂しなくなった」という報告が寄せられるようになっていましたが、OpenAIによると今回のアップデートによってのタスク完遂率が向上しているとのこと。なお、GPT-4 Turboの一般公開は「今後数カ月以内」とされています。

◆モデレーション用モデルが更新される

OpenAIはテキストの有害性を数値化するモデレーションAPIを無料で開放しています。今回の発表において、これまでで最も安全性の高いモデレーション用モデル「text-moderation-007」がリリースされました。モデレーションAPIの使用方法についてはOpenAIのドキュメントに記載されています。

◆管理ツールの更新

APIキーに権限を割り当て、読み取り専用にしたり、特定のエンドポイントだけにアクセス可能にしたりすることが可能になりました。また、APIキーごとに使用状況を追跡することが可能になり、個別のAPIキーを用意するだけで機能やチーム、製品、プロジェクトなど任意の単位で使用状況を表示することができるようになっています。



なお、新たに作成したAPIキーについては個別の使用状況の追跡が自動で有効化されているものの、従来のAPIキーについてはダッシュボードで個別の追跡を有効化する必要があるとのこと。今後数カ月かけて特に大規模な組織向けにAPIキー管理機能を改善していくと述べられています。