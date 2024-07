ChatGPTで生成AIブームの火付け役となったOpenAIが、次世代モデルの開発を加速させている。ロイター通信によれば、同社は今「Strawberry」と呼ばれる新型の人工知能を開発中だが、これはChatGPTなど従来の生成AI(大規模言語モデル)に欠けていた推論能力(論理的な思考力)を備えているという。

Strawberryは昨年11月、OpenAIのサム・アルトマンCEOが突如解任された社内クーデターの背景にあると噂された「Q*」と実質的に同じAIであるという。当時、このAIの安全性を巡る社内の不和が解任劇の一因とも見られたが、結局その真偽は不明のままアルトマンCEOの復職という形で同クーデターは幕を閉じた。

それから半年以上が経過した今、Strawberryの開発は既にOpenAI社内で実際にデモできる段階にまで進んでいるが、たとえば数学や自然科学の分野における高度な推論などデモを間近に見た関係者が驚くほどのレベルに達しているという。

発明やイノベーション、チームワークまでも

こうした前衛的なデモと並行する形で、OpenAIは同社の最終目標とする「AGI(人間と同等かそれ以上の汎用人工知能)」に向けた開発計画も明らかにしている。それは全部で5段階に分かれるが、最初の段階「Level 1」は「人間と自由に会話できるAI」に該当し、これは既にChatGPTやそのベースにある大規模言語モデルGPT-4などによって実現されている。

この後に来る「Level 2」のAIでは、(数学や自然科学などの)博士課程と同水準の問題を解くことを目指すという。この段階で恐らく(前述の)Strawberryに育まれた推論能力等が活かされることになるのだろう。

その先にある「Level 3」では、単に人と会話したりハイレベルの問題を解いたりするといった試行段階を脱して、実務的な行動を伴う「作業」や「仕事」をAIに任せられるようにする。いわゆる「Agent(代理作業者)」と呼ばれる生成AIの開発がその段階に該当する。

さらに、その先の「Level 4」では「新たな技術の発明やイノベーション」ができる生成AIを目指す。

そして最終段階の「Level 5(AGI)」では、それら個々の英知を有機的に結合した「組織的な高度作業」を担うことのできる生成AIの実現を目指すという。つまりチームワークをできるかどうかがAGIへの最終ハードルということになるが、ここにOpenAIが敢えて重きを置いていることは、いわゆる「知能」の正体や実態を考える上で興味深いところでもある。

このOpenAIと同様、全部で5段階に別れたAGIの開発計画はグーグルのAI研究部門「DeepMind」も2023年11月に発表している。OpenAIとグーグルの間で具体的なアプローチは異なるが、段階的つまり徐々にAGIを実現していこうという姿勢は両社に共通している。

参照)Levels of AGI for Operationalizing Progress on the Path to AGI(Submitted on 4 Nov 2023)

最近のAIブームの中でAGIはともすればSF的な色合いが強くなってしまうが、これらOpenAIやグーグルによる段階的な開発方針は、そこに現実性を持たせるうえで何らかの意味を持っていると言えるだろう。

人間の知能は線形には実現できない、という見方も

ただ、彼らのような開発当事者がそこまで努めても、外部からは否定的な見解もしばしば聞かれる。「人間の知能は本来、そうした5段階のような線形あるいは単純明快な基準では計り知れない」というのが否定論の主旨だ。

たとえば知能の主要な一環をなす「創造性(creativity)」では、ChatGPTのような生成AIはむしろネガティブに作用するという調査結果が最近、University College London の研究者らによって報告されている。

参照)Generative AI enhances individual creativity but reduces the collective diversity of novel content(Science Advances, 12 Jul 2024)

同調査では数百名の被験者にある種の小噺(short story)を書かせ、その際に生成AIを活用したグループとそうでないグループが書いた作品を、評価者が(テーマの新規性や内容から喚起される情感などを測定する)ある種の客観的な指標を用いて評価した。

その結果、もともと作文が極めて苦手な一部の被験者を除けば、総合的に見て生成AIを活用したグループの作品はどれも似通っており多様性・新規性に欠けるなど、活用しなかったグループよりも評価は低かったという。

実はこれと同様の調査は当のOpenAIもかなり前から実施している。

同社は2017年頃、つまり大規模言語モデル(LLM)の開発に着手した当初から、一部の作家らにそれらLLMを実際に使わせて、小説など自らの作品に対する影響をプラスとマイナスの両面から評価させている。これらの作家は、一部の文章を実際にGPT-3やGPT-4等に書かせてみて、それを自分の作品に使えるかどうかを試してみた。

ただし本来これは科学的な調査研究ではないので、客観的な調査結果は導き出されていない。しかし概ね評価者(作家ら)の見解の一致するところでは、どうやら小説等に見られる創造性(つまり面白さ)はAIで実現するのが最も難しい領域であるようだ。

「創造性」とは何なのか?

その主な理由は。その種の創造性を線形(段階的)に実現していくのが困難であるからだ。上記OpenAIの調査(実験)に参加した作家の中には「GPT-3からGPT-4になると、生成される文章はむしろつまらなくなった」と評価する人も少なくなかった。

なぜ、このような結果になったのか?

GPT-3の回答に見られる数々の「誤情報」や「幻覚」「偏見」などの問題に対処するため、OpenAIの技術者らはGPT-4の回答をできる限り「精度が高く、良識に従い、安全で予測可能」となるように改良していった。

しかし小説などで読者の関心を惹く魅力的な登場人物とは多くの場合、社会常識や良識など意に介さないアウトローだ。周囲が放っておけば何を言い出すか何を仕出かすか分からないようなキャラクターが展開する、予測不能な筋書きに私たちは惹きつけられるのではなかろうか。

逆にOpenAIの技術者らがGPT-4の精度や安全性、良識や予測可能性を高めようとする努力は、結果的に(そうしたAIが出力する)小説のように本来クリエイティブな作品の面白さを相殺してしまったようだ。

ここに見られるようにAGI、つまり「汎用的な人工知能」の一部を成す「創造性」は、GPT-3からGPT-4といった段階的あるいは線型的な改良としては実現し難い。そうした創造性は、客観的あるいは数値的な評価指標として成立し得ないだけではなく、本来「精度」や「予測可能性」など科学的な評価基準とは、むしろ相反するものであるからだ。

真の創造性に不可避の「二面性」

しかしAGIが真に「汎用的な知能」を謳う以上は、これら対極にある両基準を妥協の産物としてではなく、最高水準のものとして実現する必要がある。

これは至難の技だが不可能ではないはずだ。なぜなら科学者の中でも天才と呼ばれるような一部の人間はそれを実践しているからだ。こうした特殊な人たちは本来矛盾する2つの側面を自らの内部で両立させることができるようだ。

このように一部の人間にできるのであれば、それは今後のAI開発でもやってやれないことではないだろう。しかし、そこで問題になるのは真の創造性が必然的に備える「善」と「悪」の両面性だ。

OpenAIのアルトマンCEOは第二次大戦中に原爆開発のマンハッタン計画を指揮した物理学者ロバート・オッペンハイマーに自らを重ね合わせていると言われるが、使い方次第では軍事利用にも平和利用にも可能な「核分裂(核エネルギー)」に匹敵する重要技術を、いずれAGIは続々と生み出していくことになるかもしれない。

OpenAIやグーグルなど開発者側にとって本当の問題は、恐らく「そうした創造的なAI(AGI)を技術的に実現できるかどうか」ではなく、それを社会つまり私たち自身が受け入れるかどうかにあるだろう。

