「景気は堅調」"店やタクシー"の声を解析

写真拡大

景気動向を把握するツールの一つとして、エコノミストや投資家に重宝されているのが、内閣府が毎月発表する「景気ウォッチャー調査」(街角景気指標)だ。小売店や飲食店、タクシーなど、景気に敏感な現場で働く全国2050人の人々の景況感を集計し指数化したものだが、三井住友アセットマネジメントの渡邊誠シニアエコノミストは、指数とともに公表される回答者のコメントに着目。多量の文書をコンピューターで分析するテキストマイニングの手法を用い、どんなキーワードがよく登場するかという切り口から、より客観的な景気動向分析の可能性を探った。その結果は――。

■国が集めた地域・業種ごとの「リアルな声」

経済指標を見る限り、足元の景気は堅調である。一方で、回復感がないと感じる人も少なくないようだ。実際、人々は現在の景気をどう捉えているのか。

それを捉える試みの一つとして、景気ウォッチャー調査、いわゆる街角景気指標がある。全国11の地域を対象に、家計動向、企業動向、雇用等、代表的な経済活動の動向を敏感に観察できる業種の、適当な職種の中から選定した2050人の景況実感を調査し、それらを指数化したものだが、非常に面白いのが、同時にそれら調査対象者の景気判断の理由も取りまとめている点である。1〜2行程度の簡単なコメントだが、毎月、景気の現状・先行きについてそれぞれ1000を超えるコメントが公表されている。

6月の調査では、「梅雨入り後も晴天が続き、衣料品や身の回り品に加え、お中元ギフトの受注も順調に推移しており、月末からのクリアランスセールにも期待がかかる。また、インバウンド売り上げも相変わらず好調である(近畿=百貨店)」などといったコメントが寄せられている。地域、業種ごとの特徴的かつリアルな声を拾うことができ、エコノミストの間では非常に重宝されている。

■2700コメント×3年6カ月分をコンピューターで分析

その一方で、現状・先行き合わせて2000を超えるコメントを毎月読み込み、街角の声を客観的に分析することは簡単な作業ではない。今回、街角の声をより客観的に分析する試みとして、「テキストマイニング」の手法を用い、景気判断についてのコメントを解析してみた。「テキストマイニング」とは、テキスト(文書)をコンピューターで探索する技術の総称であり、その典型的な手法の一つが、テキストにおける単語の使用頻度を測定し、その特徴を統計的に分析・可視化することで、テキストの背後にある有益な情報を探るというものである。

テキストから単語の使用頻度を測定するには、文章を単語に区切る技術である形態素解析が必要だ。今回は、代表的な日本語形態素解析器である「MeCab」をベースにテキストを解析するパッケージ、「RMeCab」を用い、景気ウォッチャーのコメントから頻出キーワードとその使用頻度を抽出し、分析した。

※RMeCabの使用方法については、『Rによるテキストマイニング入門』(石田基広著、森北出版)、『Rによるやさしいテキストマイニング』(小林雄一郎著、オーム社)などが詳しい。

具体例を挙げよう。「梅雨入り後も晴天が続いたため、レジャー等が堅調だった」という例文をMeCabにかけると、図表1のような結果が出力される。「梅雨入り/後/も/晴天/が/続い/た/ため/、/レジャー/等/が/堅調/だっ/た」という形で文が区切られるが、これをRMeCabにかけると、スラッシュで区切られた後の各単語の使用頻度を測定することができる(品詞などの情報も付加される)。例文では、「た」(助動詞)という語が重複しているが、「た」の使用頻度は2という形で出力される。例文では1文にとどめたが、複数の文から成る文書をまとめてRMeCabにかければ、その文書内で使われている単語全ての使用頻度が出力される。月ごとにコメントを集約してテキストファイルを作成すれば、時系列での比較も可能になるし、CSV形式で出力できるため、エクセルによる集計作業も容易だ。

■「不安」だけでなく「不透明」「不確実」なども確認

さて、本題に移ろう。今回、RMeCabを用い、景気ウォッチャーによる景気判断理由集の現状/先行きのコメント(それぞれ毎月約1300コメント/約1400コメント)について、時系列(期間は2014年1月〜2017年6月、、以下の図表も同期間)に沿って、使用されている単語、及びその使用頻度のデータを抽出した。ただし、MeCabは、全ての専門用語や固有名詞に完全に対応しているわけではなく、筆者に好ましくない形に単語を区切ってしまうケースもある。例えば、「マイナス金利」をMeCabにかければ、「マイナス」「金利」の二語として抽出されるし、「有機EL」は「有機」「E」「L」という形に分割されてしまう。このため、景気ウォッチャーに登場するこうした語についてはRMeCabで別途辞書登録し、筆者の意図する形で抽出されるようカスタマイズした。

その上で、抽出されたキーワードが文字通りの意図として使われているかを確認するため、複数の類義語・関連語の使用頻度との比較なども行った。例えば、将来への不安感を示す言葉としては、「不安」のほかにも、「不透明」「不確実」などの言葉が考えられる。「不安」だけでなく「不透明」「不確実」などの使用頻度もあわせて確認すれば、不安感の変化を捕捉する上で情報は補強されるだろう。

また、RMeCabで抽出されるのはあくまで単語とその使用頻度で、その単語が必ずしも肯定的に使われているかを示すわけではない。つまり、「不安」という言葉が、「不安である」という文脈で使われているか、「不安でない」という文脈で使われているかは識別できない。そのため、上述のような類義語・関連語の使用頻度などとのクロスチェックに加え、その単語がどのような文脈で使われているかを観測するために、形態素の連なりであるNグラムの使用頻度もあわせて抽出した。Nグラムとは、ある単語がどのような単語との連なりの中で使われているかを観測するもので、例えば「期待」の後に「できない」が続いた場合には、「期待―できるーない」という3語から成るNグラムが作成される(Nは形態素の数で、N=3の場合、三つの語から成る連なりが抽出される)。「期待」という語の使用頻度が増加しているときに、「期待―できるーない」というNグラムの使用頻度が同じような動きをしているのであれば、「期待」は必ずしもポジティブには使われていないことを意味する。

■強気の言葉と弱気の言葉、どっちが多い?

前置きが長くなったが、それでは実際に景気ウォッチャーのコメントをテキストマイニングすると、どのような結果が得られるのか。1カ月あたりのコメント数は、現状が1300コメント前後、先行きが1400コメント前後、そこで用いられる単語の数はおおむね45000語前後である。その中には「が」「て」「に」「は」などの助詞、「。」「、」などの記号も多く含まれ、単純に使用頻度順にスクリーニングをかけると、こうした助詞や記号ばかりになってしまうが、RMeCabでは品詞情報も抽出されるため、品詞でスクリーニングすれば、こうした助詞や記号は簡単に排除できる。

しかし、名詞、動詞、形容詞などに絞っても20000語近くあるため、最終的にはエコノミストとして景気ウォッチャーのコメントを読み込んできた経験知を生かし、キーワードをいくつかのカテゴリーに分け、絞り込んだ上で、それぞれの使用頻度を時系列で観測した。(RMeCabでは、テキストの量の影響を調整し、使用頻度を標準化することもできるが、わかりやすさを求める観点からも、以下では使用単語数をベースとして分析を進める)

まず重要なのが、景気の方向性を占うキーワードであろう。例えば、景気にポジティブなキーワードとしては、「好調」「好況」「回復」「改善」「拡大」「堅調」「順調」「持ち直す」「上向く」など、景気にネガティブなキーワードとしては「悪化」「苦戦」「減少」「縮小」「低迷」「低調」「停滞」「不振」「不調」など、景気に中立的なキーワードとしては「横ばい」「変わらない」「維持」「安定」などがある(※「変わらない」はMeCabでは「変わら」「ない」の二語に分かれるが、使用頻度が多いため、筆者が別途辞書登録した)。これらの景気の方向性を示すキーワードの使用頻度を合計し、合計に占めるポジティブな単語の比率、ネガティブな単語の比率、中立的な単語の比率を時系列で見たのが図表2である。

現状のコメントにおけるポジティブ・ネガティブ比率の動きを見ると、昨年4月以降、ネガティブ比率がポジティブ比率を上回っていたが、11月以降はポジティブ比率がネガティブ比率を上回っている。熊本地震の影響や英国の欧州連合(EU)離脱で低迷した後、昨年秋ごろから持ち直した実体経済の動きと整合的であり、景気ウォッチャーのコメントを分析することの有用性・意義は担保されたと言えるだろう。

■国際ニュースは景況心理にどう影響したか

ここからは別のカテゴリーについても見ていこう。切り口はいろいろあるだろうが、昨年以降、人々の口の端に多く上ったのは、やはり国際情勢であろう。実は、国際情勢に関するキーワードの使用頻度を見ると、非常に興味深いことが分かる。昨年以降、世界を揺るがしたのが英国のEU離脱(BREXIT)、米国におけるトランプ大統領の誕生、今年に入っての北朝鮮情勢だが、景気ウォッチャー調査の現状のコメントを分析すると、BREXITに関するキーワードの登場頻度が70であったのに対し、米大統領が33、北朝鮮は13にとどまった(いずれもピーク時の使用頻度で、例えば北朝鮮情勢については、「北朝鮮」だけでなく、「朝鮮半島」「ミサイル」といった関連語も含む)。先行きのコメントを分析しても、BREXITが371、米大統領が174、北朝鮮が79と登場頻度は大きく異なる(図表3、4)。

国際情勢の緊迫化に人々が徐々に慣れていったということもあるのかもしれないが、今年の4月以降、北朝鮮情勢の緊迫化にもかかわらず、景気の堅調が続いているのは、多くの人が北朝鮮情勢が景気に与える影響が小さいと考えた(ゆえに、登場頻度が少なかった)という面もあったのではないだろうか。

■北朝鮮情勢は景気動向に大きな影響を与えず

もう一つ興味深いのが、BREXITによる景気への影響が大きいと人々が考えた(ゆえに登場頻度が大きかった)ことには、資産市場の変動も関係していたことを、今回のテキストマイニングの結果が示唆している点だ。資産価格に関わるキーワード(「円安」「円高」「株高」「株安」など)の登場頻度を見ると、北朝鮮情勢への懸念が高まった今年の4月前後では低位に安定しているのに対して、BREXIT決定のタイミングでは、「円高」の登場頻度が大幅に増加したほか、「株安」、「株価」の登場頻度も増加している(図表5)。ちなみに、Nグラム分析の結果を見ると、BREXITのタイミングで「株価」の前後に登場する単語は「下落」「低迷」がほとんどで、「株価」はネガティブな方向性を示す意味で使われていた。

同様に、人々の不安に関わるキーワード(「不安」「不透明」「懸念」「心配」など)の登場頻度を見ると、BREXITのタイミングでは現状/先行きのいずれのコメントにおいても大きく増加したのに対し、北朝鮮情勢への懸念が高まったタイミングでは、現状のコメントにおいて小幅増、先行きのコメントにおいてはほぼ横ばいであった(図表6、7)。

以上のことから、景気ウォッチャーのコメントをテキストマイニングした結果から判断すると、昨年の春以降、BREXITに伴う資産市場の変動が人々の不安心理を高めたが、その後、資産市場の安定とともに人々の不安心理は和らぎ、景気は持ち直しへと転じた。今年に入り、北朝鮮情勢は緊迫したが、資産価格の大幅な変動を伴わなかったこともあってか、人々の不安心理をそれほど高めることはなく、結果として景気動向に大きな影響を与えるものとはならず、景気の堅調な状況が続いているということになろう。

ちなみに、消費抑制に関連するキーワード(「節約」「買い控え」「財布のひも」など)の登場頻度を見ると、現状、先行きともに足元で低下傾向にあり、不安心理の和らぎとともに、消費の抑制スタンスも緩和している様子が見てとれる(図表8、9)。足元の堅調な消費関連の経済指標の動きとも整合的である。

■「人手不足」「アニサキス」など、切り口は自由自在

足元で注目が高まる人手不足や値上げに関わるキーワードについても見てみよう。「人手不足」については、これまでも現状、先行きのコメント共に一定程度登場していたが、今年に入り、「人手不足」の登場頻度は上昇傾向にあり、人手不足感が強まっている様子がうかがわれる(図表10)。ちなみに、「人手不足」についてNグラム分析の結果を見ると、「人手不足」の前後に登場する単語は実にさまざまだが、それでも足元では、「続く」「継続」「深刻」「顕著」など、人手不足の継続や深刻化を示唆する文脈で使われるケースが散見された。

一方、「値上げ」の登場頻度も、現状、先行きのコメントの両方で、今年に入ってから増加傾向にある(図表11)。宅配便の値上げ報道や酒類の値上げが影響しており、Nグラム分析でも、「値上げ」の前後に登場する単語は「酒類」「ビール」などが目立つ。ただし、コアインフレ率が1%を上回った2014年、コアコアインフレ率が1%を上回った2015年と比べると、「値上げ」の登場頻度は少なく、当時と比べると値上げ圧力が強くない可能性が示唆されている。日銀の目指す2%インフレへの距離は、2014年、2015年時点と比べても遠いということかもしれない。

■「猛暑」は消費を押し上げるか

景気ウォッチャーに特有の切り口としてあるのが、天候要因である。ウォッチャーのコメントに登場する天候関連のキーワードの頻度により、ウォッチャーが天候の変化による景気への影響をどう捉えているかを見ることができる。例えば、暑い夏、猛暑効果は消費を押し上げる可能性が指摘されるが、暑い夏に関連するキーワード(「猛暑」「酷暑」「暑い」など)の登場頻度を見ることで、猛暑効果を推測できるかもしれない。2014年〜2016年の期間では、2014年で暑さ関連のキーワードの登場頻度が相対的に少なく、2015年、2016年は多かった(図表12)。消費関連の経済指標を見ると、2015年、2016年の夏場の消費は堅調だった。今年の夏の暑さについては、ウォッチャーはどうコメントするだろうか。

このほか、前月あるいは前年と比較し、どのようなキーワードが急増、急減しているかを見れば、トレンドの変化などを探ることもできるだろう。残念ながら、5、6月は、登場頻度が目立って変化したキーワードはあまりなく、強いて挙げれば「アニサキス」(5月4→6月12、現状)で、一部で鮮魚の販売減につながっているようである。最近になり、景気ウォッチャーのコメントでも「4K」、「8K」テレビ、あるいは「有機EL」テレビというキーワードを目にするようになったが、これら3語の合計でも5月が2件、6月5件にとどまっている(いずれも現状のコメントにおいて)。東京オリンピックに向けて買い替え需要が期待される中、今後、増加してくるかに注目したい。

8月8日には、7月分の景気ウォッチャー調査が公表された。7月は東京都議選、内閣支持率低下など、政治がメディアを賑(にぎ)わせた。天候面では、九州や秋田をはじめ各地が豪雨に見舞われた。7月分のコメントについても早速解析したところ、「豪雨」に関するキーワードがやはり増加したが、現状のコメントでは不安に関わるキーワードは引続き減少し、消費抑制に関するキーワードも減少していた。天候要因が景気にもたらす影響は一時的ということだろう。一方で、特に先行きのコメントにおいて、「政治」「政局」「政権」など、政治に関わるキーワードが増加し(6月36→7月72、先行き)、同時に人々の不安心理も若干高まった。人々の政治への関心は高く、景気にとって政治の安定は重要ということだろう。

----------

渡邊 誠
三井住友アセットマネジメント シニアエコノミスト
1974年、東京都生まれ。一橋大学大学院 国際企業戦略研究科修士課程修了。98年慶応義塾大学経済学部卒業後、第一生命保険入社。第一生命経済研究所経済調査部、ドイツトレーニー、ロンドン駐在などを経て、2012年1月BNPパリバ証券入社、経済調査部シニアエコノミストとして勤務。16年2月より現職。

----------

(三井住友アセットマネジメント シニアエコノミスト 渡邊 誠)