Yahoo! 検索ビッグデータで判明、日本人が「密かに悩んでいること」 夜中になるほどネガティブに…

写真拡大 (全5枚)

いまや我々の生活に欠かせないパソコンやスマホ。でもいったいみんな何を検索しているのだろう。ビッグデータを解析することで、これまで知ることのできなかった日本人の新事実が明らかになった。

初任給の使い道は?

「新入社員は5月に会社を辞めたくなり、6月に社内恋愛に憧れる」

若かりし頃を思い出して、「私もそうでした!」とか「確かに周りにそんなヤツがいたな」という読者諸兄も多いだろう。

それもそのはず、これは統計的に証明されたひとつの事実なのだ。説明するのは、「Yahoo!ビッグデータレポートチーム」の編集長・池宮伸次氏だ。

「スマホの普及で、いまや日本人の多くは、困ったことやわからないことがあると、まずネットで検索して解決方法を探す傾向にあります。

その検索データの蓄積を分析すれば、どういう属性にいる人たちが、年間のどの時期に、どのような出来事に直面したり、不安や悩みを抱いたりするのか推定できるのです」

'96年から現在まで、日本の代表的なウェブサービスとしての地位を確立しているヤフーには、日々、何千万人単位の日本人の膨大なデータが蓄積されている。

こうして集められたデータ群である「ビッグデータ」を解析することで、日本人に関するさまざまな新事実がわかってきたという。

「これまで感情や気分、感覚という要素については、統計データがなかったり、そもそも調査が難しかったりしました。でも大量の検索されたキーワードを分析することによって言語化、可視化できるようになってきたのです」(池宮氏)

池宮氏の属するYahoo!ビッグデータレポートチームは、データの持つ力と面白さをわかりやすく、広く世に伝えるため、さまざまなレポートを作成してきた。

それを1冊の本にまとめたのが、9月に刊行された『ビッグデータ探偵団』(講談社現代新書)だ。ビッグデータによって判明した「日本人の正体」を見ていこう。

まずは冒頭にもあった新社会人に関するデータだ。4月25日は、多くの新入社員にとっての大きな記念日。そう、待望の「初任給の日」だ。最近の若者たちは初任給を何に使っているのだろうか。

'17年の検索ワードのデータを調べると、「初任給」とともに検索されるキーワードの1位は「プレゼント」であった。

さらにその下には、「初任給 両親」や「初任給 親」というキーワードが登場している。初めての給料でプレゼントを購入し、親に感謝の気持ちを伝える……なんともほっこりする結果だ。

何に悩んでいるかわかる

さて本題はここから。

「『初任給 プレゼント』と検索する人々は、明らかに新社会人だと推定できますから、この人たちを『新社会人』属性を持つグループと設定します。

そして、全体と比較して特徴的な検索傾向があれば、そこから新社会人の傾向を浮かび上がらせることができるのです。

これを時系列に見ていくと、新社会人たちが、いつ頃、どのような悩み事を抱えるのかがわかるという仕組みです」(池宮氏)

新入社員が4月から5月にかけて検索するのが、「光熱費」や「洗濯機 使い方」など。ひとり暮らしを始めたと思われる人のワードが目立つ。

中でも面白いのが「足の臭い」に関する検索数が上昇することだ。気温が上昇し、外歩きなどで革靴のムレが気になってくる頃。「臭い」のようなデリケートなことは、友人や親にも聞きづらいため、ウェブ検索に頼る人も多いのだろう。

Photo by iStock

5月も後半になると新入社員を大きな危機が襲う。「新卒 辞めたい」「仕事 行きたくない」など。世間的にも「五月病」と呼ばれる時期だが、リアルなデータがこれを裏付けている。

こうした新社会人たちも6月に入ると、新生活に慣れてきたのか「休日の過ごし方」など、仕事以外の検索ワードが多く見られるようになる。

他にも「彼女 作り方」「同期 恋愛」「ダーツ 投げ方」など。同期の異性とダーツバーなんかで仲良くなれたら……ちょっとばかり、心にも余裕が出てきたようだ。

職場での悩みも、検索ワードに登場してくる。「モットーとは」「眠気を覚ます方法」「会話が続かない」「自己紹介 面白い 例文」。「一発芸 簡単」というのもある。宴会を控えて、出し物に頭を悩ます様子が浮かび上がる。

12月下旬には今時の若者らしい検索ワードが急上昇する。「上司 年賀状」だ。スマホが普及して以来、若い人たちの間では年賀状を一通も出さないというのは珍しくない。

「面倒だが、やはり社会人のマナーとして、上司には年賀状を送っておくべきなのだろうか?」

現代っ子も上司との関係に気を遣っているのだ。

同じ手法で、子育てママの悩みも、データが明らかにしている。前掲書から抜粋しよう。

「女性が子供を出産したあと、夫へのイライラが最も気になるのは生後45日目頃、子供の指しゃぶりが気になるのは生後56日目頃、(子供の)髪の毛の逆立ちが気になるのが生後61日目頃、わが子をモデルに応募したくなるのは生後102日目頃」

出産直後は心配して労ってくれた夫も、1ヵ月も経った頃には子育ては任せきりに。

不満を募らせる妻だが、次第にそんな夫は放っておけとばかりに親バカに拍車がかかってくる、といったところだろうか。こうしてキーワードを時系列に眺めていくと、「日本人の典型」とも呼ぶべき姿が浮かび上がってくる。

Photo by iStock

ヤフーの検索にはさまざまな機能が搭載されている。そのひとつが「Yahoo!リアルタイム検索」だ。

「主にツイッターやフェイスブックなどSNSに投稿された記事を検索できる機能で、『リアルタイム』の名の通り、数秒前に投稿された記事も検索可能です。

これを利用して、ツイッターの投稿を解析し、『今その瞬間』の状況や感情について調査を行いました」(池宮氏)

これにより、年間の日付単位から、さらに一日の中の時間単位の日本人の行動が明らかになった。

朝4時に「死ね」と呟く

まず朝6〜7時には、「明るい」「眠い」「健康的」「穏やかな」「がんばろう」と総じて、比較的ポジティブなワードを書き込む人が多い。

昼から夜にかけて見ていくと、12時には嬉しいランチ、「もぐもぐ」「うきうき」「安い」。13時には「満腹」「あったかい」など、お腹を満たして満足している様子である。

19時台に夕食をとったら、テレビやネットを見ながら「かっこいい」と叫んだり「かわいい」とほころんだりする。

ところが、夜が更けるにつれ、様子がおかしくなり始める。午前3時の時間帯特徴ワード1位は「まずい」、4時には1位がとうとう「死ね」に。

夜更けにスマホ片手にネガティブな感情に苛まれている人たちが少なからずいる。紛れもなく現代日本人の一面であろう。

単語が使われた時間から分析するのも面白い。

「痛い」という単語に着目してみよう。たとえば「腰が痛い」というワードが書き込まれるのは朝8〜9時に集中し、「頭が痛い」「足痛い」は夕方5時ごろである。日中頑張って頭を使ったり歩き回ったりして、疲れたのだろう。

ただ、夕方の「頭が痛い」は、単なる頭痛とは違う意味もあるかもしれない。これから上司に叱られるなど……みなさんも身に覚えがあるのではないか。

せっかくなので、日本人が苦痛を感じている瞬間をもう少し見ていくと「臭い」が多いのは、朝8〜9時台だ。主に通勤電車でのことのようである。満員電車で「隣のおやじ、なんか臭い」と感じている人がたくさんいるのかもしれない。

さて、これまで「時間」に着目してデータを解析してきたが、「場所」に焦点を当てると何がわかるのか。都道府県ごとの地域性を、検索ワードの量から探ってみよう。

昨今、国民的話題になっている「ふるさと納税」について。関西エリアでの関心が他の地域と比べて格段に高い。

納税先を変えるだけで美味しい食べ物が手に入る「お得感」は、特に関西人の心を動かしたようだ。逆に東北や北陸地方の人の関心が低いのは、そこが「ふるさと」そのものだからかもしれない。

次に食べ物についても見てみよう。麺類で比べてみると、「ラーメン」は東日本、「そうめん」は西日本と、東西できれいに2分割された。

気になるのが、ラーメンの注目度が劇的に高いのが、新潟県と山形県であることだ。事実、年間1世帯あたりの中華そば(外食)の支出金額1位は山形市で、2位が新潟市という(総務省「家計調査」2017年)。これらラーメン好きの県民性は意外と知られていないのではないだろうか。

Photo by iStock

日本人の政治観についても見ていこう。

調査期間は'17年4月〜'18年5月。政治に関するワードの検索傾向を日本各地のエリア別に調べた。すると、「原発」と「基地」に関する検索で差が見られたのだ。

辺野古の基地問題についての関心は、西日本が高いのに対して、東日本は低い。宮城県の女川原発や福島原発については、東日本の関心が高いが、西日本は低い。生活圏に近い地域の問題に注目が集まるのだろう。

2019年に入り、全国民の注目を一挙に集めた歴史的瞬間があった。新元号の発表である。

新元号が発表された今年4月1日、「令和」の検索数は、平昌オリンピックで金メダルをとった際の「羽生結弦」や東日本大震災発生時の「地震」というワードの検索数と比較しても、段違いに多かったのである。

ただ、これを世代別に見ると……。若年層で目立ったのが、「令和ちゃん」や「令和さん」など、元号と同じ名前の人がいるか調べたり、元号を発表した菅官房長官の呼称「令和おじさん」を検索したり。ネタとして消費していたことがわかる。

自民党とじゃがいも

まるでビッグデータにかかれば、なんでもわかってしまうかのようだが、全く関係のない二つの事象が見事な連動を示す……そんなこともある。下のグラフを見て欲しい。


拡大画像表示

サバの漁獲量が上がると、音楽CDの売り上げも上がっている。二つの折れ線がほぼ一致しているのだ。とはいえ、「日本人はサバを食ったら、CDを買いたくなる!」と結論づけてしまうのは早計だ。

このように片方の変化と、もう一方の変化が連動しているような関係性を「相関がある」という。

しかし、両者のデータの推移がほとんどぴったり一致しているとしても、それはまったくの偶然である可能性のほうが高い。これを「相関があるが、因果は考えにくいデータ」という。実はこうしたデータがたくさんある。

ヤフーが着目したのが、「政党支持率」だ。'14年4月から'16年3月までの各政党の支持率の推移を、日本の約8000件の統計データと比較して、波形が類似するデータを抽出した。すると、じゃがいもが売れる時に、自民党の支持率がアップすることがわかったのだ。

ちなみに民進党の支持率は青森県の平均風速と連動している。「風が吹けば桶屋が儲かる」ではないが、青森県で風が吹けば吹くほど、民進党の支持率が上がっていたのだ。

他にもみつばの卸売量と公明党の支持率、コーヒーの家計支出額と共産党の支持率が、相関関係にあることが判明した。いずれもユニークな相関だが、因果関係があるとは思えない。

データから意味を見出すのはあくまで「生身の人間」である。

「ビッグデータやAIは、そのものだけでは価値を生みません。人間が知恵を使って、目的や課題を設定し正しい分析手法やデータを選択することで初めて価値を生むことができるのです」(池宮氏)

一見、無機質なデータも使い方次第なのだ。

ビッグデータの解析によって見えてきたのは、一喜一憂したり、悩みながらも他人を気遣ったり、そんな生き生きとした日本人の姿だった。


拡大画像表示

「週刊現代」2019年10月5日号より