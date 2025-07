ドイツやアメリカの国際的研究チームが、任意の実験における人間の行動を予測・シミュレートする基盤モデル「Centaur」を発表しました。Metaのオープンソース大規模言語モデル「Llama 3.1 70B」をベースに開発されたCentaurは、160の心理学実験から得られた1000万件もの人間の選択を含むデータセットで訓練されており、実験のストーリーや構造が改変された場合や、まったく新しい領域の実験にも一般化できるとのことです。

すでに現代のAIは、かつて人間のみが可能だったさまざまなことを実現しています。たとえばチェスや囲碁のチャンピオンに勝利したり、車を運転したり、タンパク質の立体構造を予測したり、まるで人間のように自然な会話や文章を生み出したりすることがAIには可能です。しかし、記事作成時点のAIの多くは特定の領域のみに特化しており、人間とは大きく異なる存在です。チェスのチャンピオンは自分で車を運転して会場まで行くことができますが、チェスが得意なAIは車を運転できません。また、AIチャットボットは人間とスムーズな会話をすることができますが、チェスをプレイさせるとコマの動かし方を間違えるなど、非常に初歩的で奇妙なミスを犯すことがあるそうです。こうした欠点はありますが、一部の科学者らはAIが人間の心を理解する上で役に立つと期待しています。ドイツの医学系研究センターであるHelmholtz Munichの認知神経科学者であるマルセル・ビンツ氏らの研究チームは、新たに科学誌のNatureに掲載された論文で、自然言語で表現可能なあらゆる実験において人間の行動を予測・シミュレートする基盤モデルのCentaurを発表しました。CentaurはMetaのLlama 3.1 70Bをベースとしており、合計6万人以上の被験者が参加した160件の心理学実験の結果からなるデータセット「Psych-101」を用いて訓練されています。Psych-101に含まれる実験は「宇宙船を操縦して宝物を探すゲームをプレイする実験」「単語のリストを暗記する実験」「配当が異なる2台のスロットマシンをプレイしてできるだけ多くの報酬を得る実験」などさまざまで、人間の被験者が選んだ1000万件以上の選択が含まれています。研究チームはLlama 3.1 70Bに各実験の被験者を演じるように指示し、AIが人間のような反応を示した場合に報酬を与えて訓練を行いました。ビンツ氏は、「私たちは基本的に、人間の被験者が行った選択を模倣するようにロボットへ教えたのです」と語っています。訓練の後にCentaurがどれほどうまく機能するのかテストしたところ、Centaurはデータセットに含まれていない実験でも、被験者がどのように反応したのかを正確に予測しました。また、「宇宙船を操縦して宝物を探す」といったゲームを改変して「空飛ぶじゅうたんを操縦して宝物を探す」といった内容にしてプレイさせてみると、人間の被験者と同じようにCentaurも宇宙船で編み出した戦略を空飛ぶ絨毯にも適用したとのことです。Centaurは、データセットに含まれていなかった論理的推論に関する質問に対しても、人間が正解した質問には正しく答え、人間が難しいと感じた質問にはうまく答えられないという傾向を示しました。ビンツ氏は、「ここではCentaurの反応にかなりの一般化が起こっています」と述べました。Centaurの開発に関与していないスタンフォード大学の認知科学者であるラス・ポルドラック氏は、「Centaurは実に素晴らしいものです。これは人間とまったく同じようにあらゆる種類のタスクを実行できる初めてのモデルです」と高く評価しました。ビンツ氏は、「最終的には人間の心を全体として理解し、これらすべてがどのようにつながっているのかを解明したいと考えています」と述べました。研究チームは心理学実験のデータベースを5倍に増やす作業を進めており、Centaurのさらなるトレーニングを計画しているとのことです。Centaurは以下のHugging Faceページからダウンロードすることができます。marcelbinz/Llama-3.1-Centaur-70B-adapter · Hugging Facehttps://huggingface.co/marcelbinz/Llama-3.1-Centaur-70B-adapter