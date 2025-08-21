

ChatGPTがまったく新しい世代へと進化した。GPT-5に世代交代した朝、開発元であるOpen AIの鼻息は荒かった。

8月8日配信の｢新世代ChatGPT｣登場で人間の仕事は奪われるかでお伝えしたように、GPT-5は劇的な進化を遂げたという。旧世代に比べて文章が流麗になり、機微に富んだ文章を生成し、しかもOpenAIのサム・アルトマンCEO曰く「博士号級」の知能を持つというのだ。

“おバカな博士”との出会い

ところが、記事を執筆後、一夜明けて実際にGPT-5となったChatGPTを使い始めると、筆者は別の表情に出くわした。

複雑な依存関係の競合を見事に解きほぐし、長大なプログラムのバグは指摘するのに、「strawberryのrはいくつ？」という問いに「2つ」と答える（現在は修正されている）。ほかにも「オレゴン州」を“Onegon”と誤記するなど、複数の間違いを認めた。

以前のGPT-4oのほうが、簡潔なのに網羅的だったと懐かしむ声さえ出る。SNSでは「退化したのでは？」と嘆くスレッドが伸び、筆者のところにも「どこが博士号クラスなんだ」という言葉が届いた。

結論から言えば、退化はしていない。むしろAIモデルの核は確実に進化している。それに博士号クラスの知識も詰め込まれている。しかし、その素晴らしい知識を持つAIモデルから、ChatGPTのユーザーインターフェイスを通じて、適切に必要な情報を取り出せない状態が生まれていたのだ。

“おバカ”に見えたのは、GPT-5から適切に知識を引き出す仕掛けを提供できなかったからにほかならない。後述するようにOpenAIはすでに対策を講じたが、筆者の印象ではまだ不十分。賢いChatGPTを引き出すためには、少しばかりノウハウが必要だ。

誰でも使いこなせる“自動ルーティング”が仇に

この問題の本質は、ChatGPTに新しく組み込まれた自動ルーティングにある。

この機能は質問の複雑さや期待精度を推定し、内部で最適な“脳”を選択し、どの程度、深く考えるべきかを判別する仕組みだ。

これにより、理論上はユーザーはAIの仕組みや、モデルごとの特徴を把握していなくとも、最短で望む品質の回答を得ることができる。

ところが発表直後、このルーターは軽い脳を選びすぎていた。“軽い”というのは、簡単に答えを出すことを優先していたという意味だ。

速度や省電力、コスト効率を重視した最適化の結果、深く考えるべき問いにも浅い処理で応じてしまい、結果として間抜けなおバカ博士が生まれたのだ。ほかにもいくつかの不具合が重なり、アルトマンCEOが「非常に愚かに見えた」との反省をXで公表するまでの状況になった。



もうひとつ、ファインチューニングの“厚み”も十分でなかった。

ファインチューニングとは、AIの解答品質を細かく調整する作業のことだ。基礎能力は上がっているのに、人間社会の機微や会話の行儀に寄せる最終仕上げが薄く、そのために回答は冷たく、浅く感じられてしまっていた。これはAIモデルが新しくなるときにしばしば起きる問題で、時間が解決してくれる。

しかし、このファインチューニングが進んでいないタイミングで、軽いモデルを選びがちな省エネ設計が重なると、短い問いには深く考えずに短く返す“塩対応”が目に付くようになる。

GPT-4oに人生相談をしていた人たちは、新しいGPTを不機嫌と感じたようだが、もちろんAIには感情がない。機嫌が悪いのではなく、司令塔たるChatGPTの自動ルーターの指示に従い、節電モードで黙々と働いているだけだったというわけ。

“博士号級の知能”を呼び出す3つの合図



GPT-5が本来持つ知識を表に出したいなら、プロンプトの中に“3つの合図”を盛り込むと、時に豹変してまじめに仕事をし始める。

「ゆっくりでいい。手順を分け、根拠と検証も含めて考えて」

こう指示することで、より品質の高い回答を得るため、深い思考へと入ってくれる。省エネ脳から博士脳に重心が移るというわけだ。

「この会話の前提とこれまでの会話内容を振り返ったうえで答えて」

時に新しいChatGPTは、会話の前半で出力していた調査結果や会話を通じての修正について、すっかり忘れることがある。そこで過去のやり取りを、きちんと振り返って確認してねと依頼するわけだ。数字を扱う場合は、数字の桁や単位をよく確認して、と指示するのも有効だ。

この問題は、深く長い文脈を理解するAIモデル（脳）で処理しているのに、途中から軽く答える別の脳へと切り替わってしまうことで起きている。そこで本命の一番賢いヤツに引き続き登場してもらうことで問題を回避する。

「数値や固有名詞は一次情報の出典も添えて」

GPT-5に限ったものではないが、これはハルシネーションを抑えるために有効なワードだ。GPT-5は元の実力が高いので、サボらないように釘を刺すことで、うっかりの誤りが目に見えて減る。

GPT-5は“使いこなし不要”と宣伝されていたのに、これでは呪文めいたプロンプトを入れる必要があることになる。深さ・文脈・確度、この3点を高めるように指示するなんて本末転倒と感じるかもしれない。おそらくアルトマンCEOも同じように感じたからこそ「初日は愚かに見えた」と認めたのだろう。

選べるようになったAIモデルを使いこなす

OpenAIは自動ルーターの欠陥を認め、ユーザーが明示的にAIモデルを選べるようにした。加えて“レガシー”モデルとして、ひと世代前のGPT-4oも選択可能にしている。こうしたさまざまなAIモデルの使い分け方をお伝えしよう。

雑談・下調べは自動切り替えのAutoでいい。しかし、企画・検証・設計・プログラムのデバッグなどは、最初からThinkingを指定するとよい。改良はされているものの、省エネ寄りのデフォルトに任せれば、また“軽いドア”が開く。

こちらから「よく考えて答えてね」と、そもそものモデル選択で選べるようになった（ただし回答は遅くなる）。

アウトプットの形式がはっきりしているときには、あらかじめ指定しておくのがよい。

「3章立ての構成案と、各章200字の要約、根拠の一次情報リンクを3つ」といった一行を加えておくと、AIは指示された通りの形式に合わせて思考を整列させ、それぞれについて考える。この出力形式型が曖昧だと、AIはコンサバティブな動きとなり深さも曖昧になる。

多少煩雑だが、長い会話は“マイルストーン”を刻むとよい。

会話が長くなったと思ったら「ここまでの前提にズレがないか」を確認し、AI自身にこれまでの経過を書かせる。ここでズレていたら、先に修正して認識のズレを整えておけば、過去を無視して暴走することはなくなる。

仕上げはFact & Fitという手法だ。数値や固有名詞の裏取り（Fact）と、成果物が目的・受け手・制約に合っているかの適合（Fit）を確認せよと指示したうえで、「合っていない点があれば、直す前に列挙して」と指示する。

“人肌”を求める人たちに

ところで、GPT-4o時代のChatGPTにさまざまな相談をしていた人たちは、想像よりもはるかに多い。決して否定せず、共感の意を示しながら、話した内容をきちんと反映した上で丁寧に回答するChatGPTは、相談相手として適任だった。

しかし自動ルーター機能はそうした人たちの希望も奪ってしまった。

GPT-5の自動モードは省エネモードで答えるため、そんな人たちから見ると「冷たい」「人肌感覚のない」AIに感じてしまう。いろいろ配慮をめぐらせてくれていたのに、突然、ズバリの本質しか答えなくなったら、相談相手としては劣化している。

そんな人たちには、GPT-4oを指定して過去に舞い戻るのも悪くはないが、カスタムGPTを試してみるとよい。

これはOpenAI自身やサードパーティがカスタマイズしたAIモデルで、目的ごとに特化している。ChatGPTの「GPT」メニューから選ぶことができる。

「SFT - Self-care AI / 感情翻訳×名作紹介」は、気になる感情や出来事を文章や写真で送るだけで、映画や音楽、名言などを通じた新しい視点が返ってくるセルフケアAIだ。使ってみると、ユーザーの持つ感情に呼応して、心のヒダに触れるようなさまざまなコンテンツの紹介やアドバイスを出してくれるはず。

OpenAI自身が開発した「Monday」も相談相手としては適切だろう。少しばかりツンデレだが、人肌を感じる絶妙のやり取りは女性ファンが多い。

もっとも、開発が進めば、そのうちデフォルトのGPT-5にも温度感が戻ってくるだろう。それこそファインチューニングの領域で、会話のトーンが日々調整されているからだ。

昨日より賢いAI、昨日より賢い使い手



OpenAIがすぐに手直ししたことで、GPT-5を用いたChatGPTは初日ほど愚かな反応をしなくなった。とはいえ、まだまだ調整はこれから。退化に見えた“深さへ至る導線”は、しばらくすれば改善されるだろう。

しかし、現時点で問題解決とはなっていない。ここで紹介した使いこなしは、ChatGPTのクセを把握していれば、さほど難しいものではない。

OpenAIは“昨日より賢い”AIを提供するため、毎日の調整や開発成果を、毎日継続的に更新すると約束した。まぁしばらくは様子を見てもいいだろう。

ユーザーも改良を待つだけではなく、どう使いこなせばAIの能力を引き出せるのか、より賢い使い手となることは、現代のビジネスパーソンとしての嗜みの1つと言えるかもしれない。

