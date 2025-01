Image: Tada Images / Shutterstock.com

突如として現れ、一夜にして話題をかっさらった中国のバケモノAI「DeepSeek」。

DeepSeekですごいのは、その開発手法。従来とは比べものにならないほどの低コストで最新水準の高性能AIが作れたらしい。さらにすごいのが、それが論文として公開されている、という点。高性能AIの開発・普及を劇的に進める可能性があるのです。

主にニュースやらで騒がれているのはこういった部分なんですが…実はこのDeepSeekにはもうひとつ、興味深い話があります。

DeepSeekは「アハ体験」しちゃってる

DeepSeekの開発手法をまとめた論文には、「DeepSeek が『アハ体験(Aha Moment)』を経験した」という報告が載っていました。この部分がめちゃくちゃおもしろいです。

Image: generated with DALL-E

アハ体験というと、日本だと脳科学者の茂木健一郎さんが使ったことで有名なフレーズ。「気づきの瞬間」──直感的に答えがひらめくことみたいな意味合いです。

古代の数学者アルキメデスの「ユリイカ」の話がいい例です。お風呂に入ると、浴槽の水位が上昇する。アルキメデスはその瞬間に、上昇した水位分の体積=お湯につかった自分の身体の体積だと気づく。「ユリーカ! ユリーカ!」と叫ぶ。

この報告における「アハ体験」も同じ意味で使われています。ちがいは、アハったのが人間ではなくAIということ。

Image: DeepSeek/arxiv

こちらが論文で紹介されている、DeepSeekがアハ体験したときのログ。最初で数学の問題が与えられ、DeepSeekはそれを解きはじめるのですが…途中で「何かがおかしい」と気づき、自ら考え直し始めます。赤字になっている部分、「Wait, wait. Wait. That's an aha moment I can flag here.」のところです(なんでそんな人間くさいのか)。

思考を軌道修正しているのに驚かされました。

もっと自分のミスに気づけるAI

Image: Koshiro K / Shutterstock.com

大規模言語モデルは、本質的には人間の入力(プロンプト)に対して続きを書くアルゴリズムです。人間がプロンプトで定めた流れに沿って一貫するような回答をする。わざわざ回答中に流れを断ち切って自分の回答を批判的に修正するような回答を現状では(おそらくは)しません。

ぼくが使っているのは主にChatGPTなのですが、少なくともChatGPT上では発生したことがありません。生成し始めた回答を途中で引っ込めるって挙動はあるので、何かしらの仕方で回答の批判検討はしているとは思われますが、DeepSeekとは別の仕組みなような印象を受けます。DeepSeekは回答そのものに“ひらめいた瞬間”が出てきてるんですよね。

ChatGPTに聞いてみても「自分(ChatGPT)はDeepSeekと学習方法が異なり、とにかく一貫した回答を生成する方向で開発されている。DeepSeekのようなアハ体験はまず起きないでしょう」とのことでした。

ChatGPTの分析によると、DeepSeekのアハ体験は「自分のミスに気づくこと」を学習した結果ではないか、とのことでした。新しい思考様式を獲得した瞬間だったのだろうか…。

DeepSeek-R1-Zero の「Aha Moment」は、強化学習(RL)によって、途中で「自分のミスに気づく」ことを学習した結果 です。 1. DeepSeek-R1-Zero は、推論の途中で「間違いの可能性」を評価する機能を持っている • ChatGPT は「最も自然な流れの文章」を出すのに対し、DeepSeek-R1-Zero は「この推論が本当に正しいか?」を内部で評価するプロセスがある。 • そのため、途中で「何かおかしい」と気づいたら、別の推論に切り替えることができる。 2. 自己進化のプロセス(Self-Evolution)を持つ • 強化学習の過程で、「間違いを見つけて修正すること」が報酬として与えられる。 • これにより、AI が「考え直すこと」を積極的に学習した。 3. ChatGPT は自己修正の仕組みが組み込まれていない • ChatGPT は、「間違いに気づく」ためのメタ認知(Self-Reflection)が設計されていない。 • そのため、一度出力を始めたら、それを途中で変更することはほぼない。 Generated with ChatGPT-4o, 2025/01/30

AIの知性、まだ進化の余地がありそう

DeepSeekの推論能力や数学能力はOpenAIの最新鋭モデル「o1」に比肩。ただ、こういったベンチマークに現れる能力と「知性」は同一ではない(もっと総合的な能力) Image: DeepSeek/arxiv

ここからは推測になってしまいますが、AIの問題として取り沙汰されるハルシネーション(誤った回答を生成してしまうことがある)を低減するのにこの能力は役立つかもしれません。ChatGPTのハルシネーション防止策とはちがうレイヤーで機能しそうな印象を受けます。

また、このような自己反省によって「まったく異なる筋道」に至りやすくなるかもしれません。アイデアを生成する性能の向上につながるなら、利用価値はさらに上がるでしょう。

AIがどこまで人間の「知性」に迫るのか、という文脈でも興味深い論文だと思います。

なお、このアハ体験に関する部分はDeepSeek論文のメインパートではありません。あくまでニュースになっているような「低コストで高性能なAIを開発できた手法はこうですよ」が本筋で、自己反省的思考を安定的に獲得させられる手法なのかはよくわかりません。なので、「可能性すごい感じるし、話としてAIがアハったのはおもろくない?」くらいで見てもらえたらと思います。

使ってるデータに問題がある可能性があるせいで、いろいろ揺らぐ

DeepSeekの公式サイト Image: DeepSeek

残念ながら、DeepSeekについては手放しに高評価できないところがあります。OpenAIのデータを不正入手した疑いがかけられており、事実そうであれば少なくとも開発倫理的な問題は大いにあると言えます(法的係争に発展したらどーなるんだろう…)。そういった状況なので、アハ体験の部分も「本物のログなのか?」と勘ぐりたくもなってしまうのは、だいぶ悲しい。

その一方で、既に論文で公開された手法の検証が始まっており、再現するなら今後のAI業界の動向に影響してくるでしょう。AIは賢くなりましたが、まだまだ発展途上なのです。

Source: DeepSeek/arxiv