じゃんけんでそれぞれの手を出す確率は3分の1と考えがちですが……(写真:mits/PIXTA)

最近の学習指導要領では、小学生の算数から高校数学まで統計を大切にする傾向がある。これは前向きに捉えたいことだ。統計は題材がとくに大切であり、多くの人たちが関心をもつものがいい。本稿では、統計を考えるうえで参考になりそうな題材を紹介したい。

筆者が数学教育活動を始めてから間もない頃の1990年代後半に、当時勤めていた大学でのゼミナール生とさまざまな統計データを収集した。駅の階段をのぼるとき最初の一歩はどちらの足からのぼるだろうか? 大きな歩道を仲良く歩く男女がいたら車道側はどちらが歩くだろうか? じゃんけんのグー、チョキ、パーを出す確率はどれも3分の1と考えてよいか? などだ。

最初の2つは統計の二項検定の実験として調査し、結論として「右足からのぼる傾向がある」「車道側は男性が歩く傾向がある」を得た。

じゃんけんの確率は本当に3分の1なのか

じゃんけんに関してはゼミ生10人にノートを渡し、多くの人たちのじゃんけんデータを記録した。調査対象はのべ725人になり、それぞれ20回以下までじゃんけんを行ってもらった。なお、当該ゼミ生は調査のじゃんけんに加わっていない。

調査の背景には大学入試の数学問題において、コインの表裏の確率はどちらも2分の1であること、サイコロで出る目の確率はどれも6分の1であること、これらは暗黙の了解として仮定に含まれている。その一方で、じゃんけんのグー、チョキ、パーの確率をそれぞれ3分の1とする仮定を述べている入試問題は、見たり見なかったりであった。

この件に関しては、1990年代の大学入試における「じゃんけんの確率問題」を10年間の受験雑誌掲載分について調べた。その結果は、問題文の仮定に「グー、チョキ、パーはそれぞれ確率3分の1で出すものとする」というただし書きがあるものとないものは、ほぼ半分半分であった。

では725人から集めたのべ11567回のじゃんけんデータからみたじゃんけんの確率はどうだったのか? 集計結果は以下である。グーが4054回、チョキが3664回、パーが3849回。したがって、「グーを出す人が多いことから一般にじゃんけんではパーが有利」だと導かれた。このデータに関して心理学的には、「人間は警戒心をもつと拳を握る傾向がある」という説明のほか、「チョキはグーやパーと比べて出しがたい手である」という説明もある。

統計学的に述べると「グー(チョキ)について特徴はなく、その確率は3分の1」という仮説を立てるとそれは棄却され(有意水準5%の正規検定とする)「人間はグーが多い」、「人間はチョキが少ない」と言える。また、そのデータから別の特徴も見られる。

2回続けたじゃんけんでは違う手を出したがる?

2回続けたじゃんけんは延べ1万833回であったが、そのうち同じ手を続けて出した回数は2465回であった。例えば、自分はじゃんけん8回戦を行って、順にグー、グー、パー、チョキ、グー、パー、パー、チョキと出したならば、そのうち、1回と2回、6回と7回が同じ手を続けて出したことになる。したがって、この場合は2回続けたじゃんけんが延べ7回で、そのうち同じ手を続けて出した回数は2回となる。

1万833回のうちで2465回という数が意味することは、「人間は同じ手を続けて出す割合は3分の1よりも低く4分の1近くしかない」ということである。このことから、「2人でじゃんけんをしてあいこになったら、次に自分はその手に負ける手を出すと有利」という結論が得られる。

統計学的に述べると「2回続けるじゃんけんに特徴はなく、同じ手が続く確率は3分の1」という仮説を立てるとそれは棄却され(有意水準1%の正規検定とする)「人間は2回続けるじゃんけんで異なる手を出したがる」と言える。

これまでにいくつかの拙著で、上記の部分を書いたこともあって、テレビへの出演や高校生の課外活動でのアドバイスなど、じゃんけんについて数多くの依頼が届いた。あまりにもその数が多く、また海外のテレビ局からも「じゃんけん博士さんですか」という電話も入るようになって困惑した。

次に、数学的に考える事例として「ナンバーズ4宝くじ」を取り上げたい。ナンバーズ4宝くじは1枚200円で購入し、4桁の数字からなる当せん番号を当てた者全員で賞金を等しく分けるくじである。したがって、当てた者の人数が多ければ賞金額は少なくなり、当てた者の人数が少なければ賞金額は多くなる。ちなみに、全購入代金の45%を賞金に当てることになっている。

今から20年以上前、1996年9月2日の「くじの日」に、筆者は某民放の生番組に出演してナンバーズ4宝くじについて話した。「当たりそうな数字をぜひ紹介してほしい」という依頼であったが、「当たりそうな数字はありません。ただ、特徴のある4桁の数字が当せん番号になると、その賞金額は高くなる傾向があります」と回答した。それから約23年が過ぎた現在も、その内容は当てはまるようだ。

この当時、当せん番号の4桁の数字と賞金額を調べた結果、0から9までの4つの数字を順番まで含めて当てる「ストレート」に関して、賞金額が理論値 200(円)×10×10×10×10×0.45=90(万円)よりわりと離れている場合が少なくないことに注目した。

ちなみに宝くじ公式サイトには”ストレートの当せん金額は約100万円(理論値は90万円)!”と記載されている。

例えば2月19日を4桁にして表す「0219」のような、日にちに関係する4桁の数字が当せん番号になると、賞金額は一般に低い傾向がある。反対に9697や8775のように、重複のある数字を含んで5以上の数字だけで構成する4桁の数字が当せん番号になると、賞金額は一般に高い傾向がある。誰でも、自分の誕生日などの記念日を表す4桁の数字を予想し、それが当せん数字になればうれしいだろう。実はそのことが、予想数字が0、1、2、3、4に多く偏っていることにもつながっていると考える。

重複のある4桁が出る確率は49.6%

また、一般に重複のある数字はあまり出ないと思う人たちが多いようであるが、それは意外にも少なくない。実際、4桁の数字が全部異なる確率を求めると、1番目の数字aは0〜9まで何でもよく、2番目の数字bはa以外の数字ならば何でもよく、3番目の数字cはa、b以外ならば何でもよく、4番目の数字dはa、b、c以外ならば何でもよい。それら全部の4桁の数字abcdは、10×9×8×7=5040(個)である。

4桁の数字は全部で10000個あるので、4桁の数字が全部異なる確率は50.4%しかない。そして、重複のある4桁の数字が当せん番号になる確率は49.6%もあるのだ。

講演会場などで「なんでも構わないので4桁の数字を想像してください。先頭が0でも構いません」と伝えて答えてもらうと、4桁の数字が全部異なる回答のほうが、重複のある4桁の数字の回答と比べて、かなり多くあるのが普通である。この傾向は、前半で述べた「人間は2回続けるじゃんけんで異なる手を出したがる」という性質と似ていることがわかるだろう。

本稿で述べたように、私たちの身の回りには実際に統計データをとってみると面白いことに気づくことはよくあるのだ。