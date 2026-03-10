遠い地域の文化がなぜ似ているのか、これは文化人類学における究極の謎の一つである。百年以上にわたり、文化人類学者たちは諸地域の文化を記述し、それらの間に構造的なパターンを見出してきた。筆者は、よく似た文化が生まれるのは、人間が社会を作る限りにおいていつでも成り立つ、「文化を生む仕組み」があるからだと考える。本連載では、数理モデルのシミュレーションによって、人間文化に普遍的な構造を生む仕組みを探求する普遍人類学の試みを紹介する。

古代から研究されている「人が協力する理由」

人が協力するのはなぜか、あるいはどのような状況であれば協力するのか。この問いは古代ギリシアの哲学者から、現代のゲーム理論家まで多くの学者の関心を集めてやまない。

二人の人がお互いの足りないところを補い合えば、一人のときよりも豊かに暮らすことができる。しかし、相手からもらうだけもらって、自分は何もしないというズルをすると、もっと得をできてしまう。だから協力は難しい。

困っている人を見たら、自分が多少の損失やリスクを負っても手助けをする。誰もがこのように振る舞う社会は、皆が自分勝手に振る舞う社会よりも良いに決まっている。しかし、人々が目先の欲求に気を取られてしまうと、そんな社会は実現できない。

この問題を扱った最古の文献の一つが、プラトンの『国家』である。利己的に振る舞うのが短期的には得になってしまうときに、どうすれば協力ができるのか？ 協力すること（正義）自体が良いことだから協力するのか、それとも「情けは人のためならず」で協力した人が得をするから協力するのか、という問題だ。

仮に、「情けは人のためならず」が、協力を実現する仕組みだったとしよう。つまり、協力すると「良い人」との評判が流れて、めぐりめぐって得をするから、人は協力をするのだとする。

その上で、次のような思考実験をしてみたい。

もしも何をしてもバレない透明人間がいたとしよう。その人は良いことをしても悪いことをしても評判にはならない。とすると、評判の恩恵を受けない人は、ズルをするのが正解になってしまうのだろうか？ プラトンはこのように考えて、正義自体の価値を考える倫理学を打ち立てた。

なぜ・どのような状況で、人は協力をするのかという問いは、その後も問われ続け、20世紀になってからは、ゲーム理論によって数理的な立場からも研究が進んでいる。数理の問題にすることで単純な損得に注目して議論できるようになる。筆者は哲学の専門家ではないので、プラトンの話はここまでにして、以下ではゲーム理論の話をしたい。

ゲーム理論の世界では、他者が利益を得るために自分が損失を被る行動のことを「協力」という。そして、一見して損な協力が、実は得になるのはどんな状況かが研究されている。透明人間は協力しないかもしれないけれど、人間は目先の欲求に囚われているかもしれないけれど、それでも私たちが協力できるのはなぜかを考えているのだ。

では、なぜ私たちは協力するのだろうか？ 常識的に思いつくのは、「困ったときはお互い様」や「情けは人のためならず」という理屈である。つまり、自分が協力をしたら、助けた相手や、その噂を聞いた誰かがいつか協力をお返ししてくれる、ということだ。

本記事では、こうしたお返しの仕組みがどのように機能するか、なぜ人間社会においてこの仕組みが特に働いているのかを紹介する。

「囚人のジレンマ」で考える協力の仕組み

ゲーム理論を使えば、協力がなぜ難しいのかを最も単純な形で表現することができる。問題の本質的な難しさだけを抽出することで、どんな仕組みがあれば、なぜ協力を実現できるようになるのかについて理解できるようになる。

ここで最もよく使われるゲームが「囚人のジレンマゲーム」である。このゲームは1950年に考案されて以来、精力的に研究されている。2025年に出版された論文だけでも、なんと9180件もの論文がこのゲームを扱っている。

ゲームの設定はこうだ。

二人の囚人を別の部屋に呼び、看守がそれぞれに司法取引を持ちかける。

「本来なら二人ともそれぞれ懲役5年である。二人とも黙秘したら証拠不十分で懲役を2年に減刑する。しかし、もしお前だけが自白すれば、相方を懲役8年に処す代わりに、お前をすぐに釈放する。二人とも自白した場合には、本来通り懲役5年とする。さあ、自白するか？」

一人の囚人になった気持ちで考えてみよう。まず、相方が黙秘しているとする。もしあなたが自白すれば、あなたは今すぐ釈放される。黙っていれば懲役2年だ。次に、相方が自白した場合はどうなるだろうか？ あなたが自白すれば懲役5年で、黙っていれば懲役8年だ。

つまり、相方がどう振る舞ったとしても、自白したほうが刑は軽い。しかし、二人とも自白してしまった場合（5年）には、両者が黙秘した場合（2年）よりも重い刑を受けることになる。つまり、黙秘する行為は、目先の減刑を我慢する（＝コストを負担する）ことで、相手の刑を軽くする（＝利益を与える）、「協力」と捉えることができる。

このモデルは非常に良くできていて、協力したほうが良いはずなのに、それを実現することが難しいということを単純な形式で見事に表現している。このモデルに色々な仕組みを付け加えて、どの条件なら協力できるのか、といった問題に今でも多くの研究者が挑んでいるのだ。

協力を促す三つの互恵性

以下では、前回の記事に引き続き、ハーバード大学のゲーム理論家マーティン・ノヴァクによる「協力の進化のための五つのルール(M. Nowak, “Five Rules for the Evolution of Cooperation”, Science, 2006）」と題する論文に則って、「囚人のジレンマゲーム」で協力が進化する仕組みを見ていこう。

前回は五つのうち、二つの仕組みを紹介した。一つ目は、親族を助ける場合には自分が損をしても構わないという血縁選択。もう一つは、社会の中で人々がいくつかのグループ（例えば会社）に分かれているとき、グループの中ではズルをする人が得をするけれど、ズルをする人ばかりのグループは廃れるので、協力する人が多いグループが生き残る（結果的に、協力行動が進化していく）というマルチレベル選択だった。

今回は、直接互恵性、間接互恵性、ネットワーク互恵性という三つの仕組みを紹介する。これらはいずれも「互恵性」つまり、互いに恵む性質で、要するにお返しのことだ。

まずは最も単純な互恵性である「直接互恵性」だ。協力が損になるのは、自分が相手に協力したのに、相手が自分に協力を返してくれなかったとき（この状況を「タダ乗り」と呼ぶ）である。うまくお返ししあう関係を築ければこの問題は解消される。

「囚人のジレンマゲーム」で最も得する戦略

政治学者のロバート・アクセルロッドは1980年に、囚人のジレンマゲームのプログラミングコンテストを開催した。彼はまず、様々な分野の研究者に、コンピュータプログラムを作って送るように求めた。そして、集まったプログラム同士で対戦をさせてどのプログラムが勝つかを実験した。(R. Axerlod, “Effective Choice in the Prisoner’s Dilemma”, Journal of Conflict Resolution, 1980.)

コンテストには、14のプログラムが集まった。そして、それぞれのプログラムは自分以外のプログラムと200回ずつ囚人のジレンマゲームをプレイし、その合計の利得が高い（懲役年数の合計が少ない）プログラムが優勝である。

集まったプログラムは色々な行動戦略を持っていた。いつでも協力（黙秘）するものもあれば、いつでも裏切る（自白）するものもあった。他にも、50%の確率で協力するという戦略もあったし、それまでに相手が出してきた手をカウントして、協力する確率を調整する、というようなものもあった。

だが、勝ったのは実にシンプルな戦略であった。その戦略は、「はじめて会う相手には協力する。すでに会ったことがある相手に対しては、前回の相手がとった行動を返す」というものである。つまり、「前回協力してくれた人には協力し、協力してこなかった相手には協力しない」ということだ。

興味深いのは、アクセルロッドがこのコンテストをもう一度開催したときの結果である。2回目のコンテストには62のプログラムが集まったのだが、またしてもこのシンプルな戦略が優勝したのだ。

なるべく協力を実現しようとする一方で、自分勝手な相手にはきちんと仕返しをするこの戦略は「しっぺ返し戦略」と呼ばれる。この戦略のいいところは、「協力を返してくれる人に対してだけ選択的に協力できる」ことである。恩恵をくれる人には直接お返しをする、ということでこの仕組みは「直接互恵性」と呼ばれている。

うわさ話が協力行動を進化させる

あえて、「直接」と言っているのは「間接」があるからである。

「直接互恵性」で協力を実現するためには、同じ人と何度も会うことが必要だ。小規模な集団でいつものメンバーとやり取りをする場合にはこれでいいのだが、現代社会では初対面の人と一度きりのやり取りをする機会が多い。二度目のやり取りがあるかもわからない相手と協力するためには「しっぺ返し」では不十分である。

そこで出てくるのが二つ目の互恵性、「間接互恵性」である。これは一言で言えば、目の前の人が協力に値する人かどうか、評判を知っていれば良い人にだけ協力するようにできる、というものだ。

ここで考える設定は、AさんがBさんに協力したかどうかを、別のCさんが見たり聞いたりできる状況である。AさんがBさんに協力していれば、Aさんは「良い人」なので、Cさんとしては「次にAさんに会ったら協力しよう」と考えることができる。逆に、自分の行動も常に他の人から見られているので、「タダ乗り」をしては評判が落ちてしまい、将来協力してもらえなくなる。

このように、評判によって協力を維持する仕組みは、言語コミュニケーションが発達した人類において特に重要である。しっぺ返しによる直接互恵性が機能するためには、一度出会った相手としょっちゅう再会するような顔見知りばかりの社会が必要だ。しかし、うわさ話を広めることで評判を共有できれば、大規模な集団でも間接互恵性によって、協力が維持されうるのである。

口コミなどは、この間接互恵性の好例だろう。美味しいご飯を出す店は評判になり、人が集まってくる。いい評判を得ることが繁盛につながるのであれば、飲食店の側もより美味しい料理を提供するように努める甲斐がある。口コミが機能するほど、その街のご飯は美味しくなっていくのだ。

協力者は協力者を呼ぶ

そして第三の互恵性が「ネットワーク互恵性」で、これは「空間的互恵性」とも呼ばれる。

直接互恵性と間接互恵性の枠組みでは、やり取りする相手はランダムに決まると考えていたが、現実には身近な人とより頻繁にやり取りをするのが普通だ。

そうした人々のつながりは、しばしばネットワークとして表現される。例えば、タダ乗りされたらその人とは縁を切って、お返しをしてくれる人とつながりを維持するというような形で人々が振る舞うと考えてみよう。そうすると、協力者の周りには協力者が集まって、コミュニティを作ることになる。

そのような、協力者と裏切り者のつながりの偏りによって協力が生まれる仕組みがネットワーク互恵性だ。協力者は協力者と、裏切り者は裏切り者と頻繁にやり取りするのであれば、協力者のほうが得になる。ポイントは協力という「良い行い」をすることで、良い人々が隣人になるということだ。

ここまで三種の互恵性を紹介した。直接・間接・ネットワーク互恵性の肝は結局、「協力を返してくれる人に対してだけ選択的に協力すればタダ乗りを防げる」ということであった。これら三種の互恵性は、それを実現するために、前回の行動の記憶に頼るか、流布した評判を参照するか、人々のつながりの偏りを利用するかが違うだけなのだ。

協力と非協力の境界線はどこにある？

協力は利益をもたらすが、「タダ乗り」されるリスクもある。そのため、皆が協力をする状態が得だとわかっていても、それを実現するのは難しい。

ゲーム理論は協力を実現するための五つの仕組みを教えてくれる。

簡単に振り返ると、

・身内を助けるならばお返しはいらないという「血縁選択」

・協力的なグループが非協力的なグループよりも栄えるという「マルチレベル選択」

・自分に協力してくれた人にだけ協力し返す「直接互恵性」

・良い人だと評判の人にだけ協力する「間接互恵性」

・身近なコミュニティで協力する「ネットワーク互恵性」

であった。

人間社会ではこれらの仕組みのいずれか（またはいくつか）が機能して、協力が生まれている。ただし、互恵性が機能するためには、人々の間で「何が協力か」が合意されていなければならない。

しかし、他人にどのくらい尽くしたら協力なのかはよくわからないこともある。赤の他人よりも自分のほうが大切なのは自然だが、どこまで自分勝手に振る舞えば「非協力」あるいは「悪い奴」の烙印を押されるのかは状況によって異なるだろう。

そこで次回からは、本記事の内容を踏まえ、共有資源の利用という文脈において人々の相互作用によって「どこまでが協力で、どこからが非協力なのか」というルール自体が生まれる仕組みを考えていく。

