OpenAIが「OpenAI o1(正式リリース版)」のAPIを公開しました。合わせて、AIとの音声会話機能を提供する「Realtime API」のアップデートや、モデル微調整機能のアップデート、GoライブラリおよびJavaライブラリのリリースも発表されています。

OpenAI o1 and new tools for developers | OpenAI

https://openai.com/index/o1-and-new-tools-for-developers/





◆OpenAI o1のAPI公開

OpenAI o1のAPIはテキストと画像の入力に対応しており、コンテキストウィンドウは20万トークン、最大出力トークン数は10万トークンです。なお、OpenAI o1の学習データには2023年10月までの情報が含まれています。



「GPT-4o(薄いオレンジ)」「OpenAI o1-preview(オレンジ)」「OpenAI o1(ピンク)」「OpenAI o1の構造化出力モード(赤)」の性能を比較したグラフが以下。OpenAI o1は各種ベンチマークで最も高いスコアを記録しています。



OpenAI o1のAPIは「reasoning_effort」というパラメーターに対応しており、推論にかける時間を調整できます。また、特定のリクエストに対してOpenAI o1-previewより平均60%少ない推論トークンで応答可能なほか、「関数呼び出し」「JSONに形式での出力」「画像推論」「開発者メッセージ」といった機能にも対応しています。

OpenAI o1のAPIはすでにティア5の開発者向けに公開されており、今後数週間をかけて提供範囲を拡大予定です。





◆Realtime APIのアップデート

Realtime APIはAIを用いて音声会話機能を提供するAPIです。新たにRealtime APIがWebRTCに対応し、ウェブアプリやモバイルデバイス、IoTデバイスなどのプラットフォーム間でリアルタイム音声会話アプリを簡単に構築できるようになりました。Realtime APIでWebRTCを活用する方法は以下のドキュメントにまとまっています。

Realtime API with WebRTC - OpenAI API

https://platform.openai.com/docs/guides/realtime-webrtc



さらに、音声品質を向上しつつコストを削減した「gpt-4o-realtime-preview-2024-12-17」と「gpt-4o-mini-realtime-preview-2024-12-17」もリリースされました。「gpt-4o-realtime-preview-2024-12-17」の価格は音声入力100万トークン当たり40ドル(約6100円)、音声出力100万トークン当たり80ドル(約1万2000円)、キャッシュ済みの音声入力100万トークン当たり2.5ドル(約380円)です。また、「gpt-4o-mini-realtime-preview-2024-12-17」の価格は音声入力100万トークン当たり10ドル(約1500円)、音声出力100万トークン当たり20ドル(約3100円)、キャッシュ済みの音声入力100万トークン当たり0.3ドル(約46円)です。



◆Preference Fine-Tuning

Preference Fine-Tuningは「Direct Preference Optimization(DPO)」というアプローチを採用したモデル微調整手法です。Preference Fine-Tuningを使うことで、「モデルの応答を2つ出力し、好ましい応答と好ましくない応答を区別するように学習させる」という操作が可能。これにより、ユーザーや開発者の好みに基づいた微調整を実行できるそうです。





Preference Fine-Tuningの詳細は以下のリンク先にまとまっています。

Fine-tuning - OpenAI API

https://platform.openai.com/docs/guides/fine-tuning#preference



◆GoとJavaのライブラリ

OpenAIは「TypeScript / JavaScript」「Python」「.NET」用の公式ライブラリを公開しています。新たに、GoとJavaのライブラリもリリースされました。

公式Goライブラリは以下のリンク先で公開されています。

GitHub - openai/openai-go: The official Go library for the OpenAI API

https://github.com/openai/openai-go



また、公式Javaライブラリは以下のリンク先で公開されています。

GitHub - openai/openai-java: The official Java library for the OpenAI API

https://github.com/openai/openai-java