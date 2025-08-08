Image: OpenAI

2025年8月8日未明、OpenAIがChatGPTの大規模アップデートを発表しました。登場が予告されていた最新性能の大規模言語モデル「GPT-5」が本日から利用できるようになります。

現時点で筆者の環境では利用できるようになっていませんが、公式ページでは「無料ユーザーでも利用可能」とされています。「課金ユーザーはほとんど制限がなく使える」という言い方を配信でしていたので、おそらくは厳しめの回数制限がかかると思われますが、最新鋭モデルを触らせてくれるのは嬉しいところ。もちろん、Plusプラン以上の課金ユーザーも利用可能です。

できることはこれまでと本質的には変わらず、変わったのは性能。今回も一言で言えば「賢くなった」のですが、知識が増えたとかそういう感じではなく、知性そのものがまたぐっと上がったような印象です。

1. まちがう・ユーザーを騙す率が激減

ベンチマーク結果を見ると、前フラッグシップo3などに比べて、ハルシネーション率が激減しています。5%くらいあったのが、1%を切っています。AIでいちばん困るのが嘘を書いてくるときがあることですが、それが減りそうってこと。

特にヘルスケア（健康）に関する質問に対する幻覚率が下がっており、専門家でないと正確な理解が難しい身体の問題についてかみ砕いて説明してもらう…みたいな使い方をしたい人には嬉しいのではないかと思います。

もちろん、ハルシネーションがゼロになったわけではないので、まだ回答を批判的に読む必要はあるでしょうけど。

また、ChatGPTはユーザーを欺く（事実性・実効性のない回答をする）ことがありましたが、その確率もぐっと下がっています。「実在しないことについて自信満々に語り出す」みたいなのが、がっつり減ってるとのこと。

発生するとかなり萎える現象なので、実際減ってるなら併せてかなり嬉しいですね。使い勝手はさらによくなってそうです。

2. 超難問への正答率が大幅アップ

ベンチマークでもう1つ目立ったのが、超高難易度の学術ベンチマーク「Humanity's Last Exam」の正答率が劇的に上がっていたことです。既にChatGPTは大学博士レベルのテストで高い正答率を叩き出しており、コーディングなどもテスト結果は頭打ちに近い状態ですが、このテストだけは正答率が低かったのです。

ダイレクトにこのレベルの知性を求めるシーンは多くないと思いますが、今までよりも複雑な問題に対応できるようになっているかもしれません。

1プロンプトからアプリをまるっと作ったりも

総じて、GPT-5の登場でまた「ChatGPTの使い勝手」が一段上がっていそうな雰囲気です。

- YouTube YouTube ã§ãŠæ°—ã«å…\ã‚Šã®å‹•ç”»ã‚„éŸ³æ\½ã‚’æ\½ã—ã¿ã€ã‚ªãƒªã‚¸ãƒŠãƒ«ã®ã‚³ãƒ³ãƒ†ãƒ³ãƒ„ã‚’ã‚¢ãƒƒãƒ—ãƒ­ãƒ¼ãƒ‰ã—ã¦å‹ã ã¡ã‚„å®¶æ—ã€ä¸–ç•Œä¸­ã®äººãŸã¡ã¨å…±æœ‰ã—ã¾ã—ã‚‡ã†ã€‚ https://www.youtube.com/live/0Uu_VJeVVfo?si=RNP5Vweweb_1mdo1&t=3792

デモでは自分専用の語学学習アプリや3Dゲームを1プロンプトからまるっと作ったりしてたので、プログラムや文章の作成など、今までもできていたこともより高水準にこなせるようになっていそうです。また、推論にかかる時間や必要なトークン数なども削減されているようです。人によって使えるようになるまでタイムラグがあると思われますが、発表では「今日リリース」と述べられていたので、待っていれば利用できるようになるはず。気になった方はこちらからアクセスしてみてください。

Source: OpenAI(1, 2), Humanity's Last Exam