OpenAIの新AI「GPT-5.5」は“実質トップ性能”
かなりいいモデルだと思います。
2026年4月23日、OpenAIが新しいAI「GPT-5.5」をリリースしました。既にChatGPTなどで利用可能になっています。
GPT-5.5は既存モデルから大きな性能の伸びを見せており、より複雑な処理を少ない指示で実現できるようになっているのが最大の特徴です。
「実際に使えるAI」としては最高の性能を示す
GPT-5.5のベンチマーク結果は既存モデルからまんべんなく更新されており、事実上、現行トップの性能を備えていると思われます。PCを操作する能力が特に伸びています。
AI性能評価サイト「Artificial Analysis」も独自のベンチマーク結果を公表しており、主要な評価項目5つで首位。3項目で次点という結果だったとのこと。弱点としてはハルシネーション率が高めであることが挙げられています。
GPT-5.5 takes OpenAI back to the clear number one in AI. OpenAI’s new model tops the Artificial Analysis Intelligence Index by 3 points, breaking a three-way tie with Anthropic and Google
- Artificial Analysis (@ArtificialAnlys) April 23, 2026
OpenAI gave us pre-release access to test all five reasoning effort levels: xhigh, high,… pic.twitter.com/RYnEwlIo9D
現在、公表されている中で最高のAIはAnthropicの「Claude Mythos」ですが、このモデルは「高性能すぎて悪用されたらヤバい」という理由で一般には公開されていません。こちらとの差もハルシネーション率という指摘がありました。
GPT 5.5 vs Mythos
- Chetaslua (@chetaslua) April 23, 2026
here is the bench compare and have fun
btw mythos is hallucination king and 5.5 is very good with effeciency and publicly available https://t.co/TZSxFHDcRj pic.twitter.com/5runlEKteh
仕事を終わらせるためのAI。
少ない指示で複雑な成果物を出してくれる
ベンチマーク結果だけでなく、「できること」も増えていると思われます。
OpenAIはGPT-5.5は「複雑な指示から一気に大きめの仕事を完了させられる」としています。エクセルに記載された投資関連情報を分析して読み取れることを書き込んだり、PCを操作してインタラクティブな研修資料がちゃんと動くかチェックさせたり、1発で高度なブラウザアプリを作ったりできる例が紹介されていました。
この記事を作るにあたってもChatGPTからGPT-5.5を用いて情報の整理や、差し込む画像を作ったりしてみましたが、実際にかなり複雑なタスクに対応していると思いました。
多数の資料や画像をアップし、それらから情報を適切に抽出させ、シンプルになるよう取捨選択するように指示しましたが、今までよりも格段にうまくこなせます。感覚的には「言えば(変に解釈せずに)やってくれる幅」が広がってるって感じになるでしょうか。「話が早くなった」と言ってもいいと思います。
先日、画像生成機能も進化した関係もあって、スライド的なビジュアル資料は抜群に作りやすくなっていると思います。
Source: OpenAI (1, 2), Artificial Analysis, Chetaslua
Anthropicが新AI「Claude Mythos」を発表。GPT-5.4・Gemini 3.1 Proを大幅に上回る超高性能モデル
