OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応

2024年7月19日 11時20分

OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。

GPT-4o mini: advancing cost-efficient intelligence | OpenAI

https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

OpenAI Releases GPT-4o Mini, a Cheaper Version of Flagship AI Model - Bloomberg

https://www.bloomberg.com/news/articles/2024-07-18/openai-releases-gpt-4o-mini-a-cheaper-version-of-flagship-ai-model

OpenAI launches GPT-4o mini, which will replace GPT-3.5 in ChatGPT | Ars Technica

https://arstechnica.com/information-technology/2024/07/openai-launches-gpt-4o-mini-which-will-replace-gpt-3-5-in-chatgpt/

OpenAIが発表したGPT-4o miniは、言語モデルのマルチタスクの言語理解を測定するベンチマークの「MMLU」で82％のスコアを獲得し、LMSYSのリーダーボードでもGPT-4を上回る評価を得たモデルです。

各ベンチマークの結果は以下のとおり。GPT-4o miniは、GPT-4oには及ばないものの、ほとんどのベンチマークでGPT-3.5 TurboやGoogleの軽量モデル「Gemini Flash」、Anthropicの小型モデル「Claude Haiku」を上回る成績を収めました。

優れたパフォーマンスを示しながらも低コストで、入力トークン100万当たりの費用は15セント(約23円)、出力トークン100万当たりでは60セント(約100円)しかかからず、GPT-3.5 Turboより60％以上も安価です。

Introducing GPT-4o mini! It’s our most intelligent and affordable small model, available today in the API. GPT-4o mini is significantly smarter and cheaper than GPT-3.5 Turbo.https://t.co/sqJsFEYHWq pic.twitter.com/g6jMttp1mF— OpenAI Developers (@OpenAIDevs) July 18, 2024

GPT-4o miniの入力コンテキストウィンドウのサイズは12万8000トークンで、リクエストごとに最大1万6000の出力トークンをサポートし、2023年10月までの知識を備えています。

コスト以外に特筆すべき点は、OpenAIが開発した安全対策技術である「命令階層(instruction hierarchy)」を組み込んだ同社初のAIモデルになるという点です。指示に優先順位をつけるこの技術により、AIモデルはプロンプトインジェクション攻撃やジェイルブレイクなどの影響をより受けにくくなります。

既に、GPT-4o miniはAPI経由での画像入力に対応しており、OpenAIは将来的にテキスト、画像、映像、音声の入出力もサポートする予定としています。

Free、Plus、TeamプランのChatGPTユーザーは、GPT-3.5の代わりにGPT-4o miniを使うことができます。また、近日中にEnterpriseユーザーもGPT-4o miniにアクセスできるようになるとのこと。

OpenAIのAPI製品責任者であるオリヴィエ・ゴードマン氏は、「最先端技術を実現し、最もパワフルで有用なアプリケーションを構築するという我々のミッションのため、今後も最先端モデルの開発を続けて限界を押し広げていきたいと思いますが、私たちは最高の小型モデルも提供していきたいと考えています」と話しました。