単純集計には少なくとも2つほど問題点がある

写真拡大

ベストセラー『統計学が最強の学問である』『統計学が最強の学問である[実践編]』の著者・西内 啓氏が、ついに待望の新刊『統計学が最強の学問である[ビジネス編]』を発表。ダイヤモンド・オンラインでは、この『ビジネス編』の一部を特別に無料公開。ビジネスパーソンに必要な「統計力」の磨き方について、ヒントをお伝えします。

 この世には数多の統計手法が存在しているが、本章のような目的で統計解析を行なうのであれば、初心者はまず重回帰分析という手法だけを使えるようになっておけばいい。

 重回帰分析とは簡単に言えば、今回取り扱う総資本利益率のような数量に対して、どのような要因がどれほど影響しているか、複数の要因と数量との関連性を一気に分析できる手法である。なお、本書の本文中における統計手法の説明の多くは前著『統計学が最強の学問である[実践編]』で述べた内容のダイジェストとなっているので、詳しく知りたい方はそちらを読まれるとよいだろう。

単純集計の2つの限界

 重回帰分析を知らない多くのビジネスマンは、たとえば営業力の高さと収益性が関連しているのかどうかといった「仮説」を検証するために集計を行なって次のような棒グラフを描く(図表1‐15)。

 これは公平な第三者に対し、分析対象とする企業それぞれについて「この企業は営業力が高いと思いますか?」と尋ねた結果をもとに、企業を分類し、それぞれのグループごとに総資本利益率の平均値を求めた結果を示している。「まったくそう思わない」と評価されたグループでは平均2%ほどの総資本利益率しか示さないのに対し、「たいへんそう思う」と評価されたグループでは5%近い総資本利益率を示している。ここから営業力こそがこの市場における成功の鍵であり、強力な営業部隊を抱えることこそが収益力を高める戦略である、という結果が導かれるのである。

 しかし、こうした単純集計には少なくとも2つほど問題点がある。

 1つめは手間の問題だ。本章ではここまで、先人の知恵を集めて、これまで自分たちが考えもしなかった膨大な数の説明変数を考えるためのアプローチを説明した。こうした手順に則っていれば、その数は数十〜数百といった数にのぼるかもしれない。

 これ自体は喜ばしいことだが、数百回もエクセルで集計を行なう、ということになればいったい何度マウスをクリックすればいいのかという話だし、仮にそこをマクロなどで効率化したとしても、数百枚のグラフに目を通さなければいけないうえに「結局どのグラフが大事なのかわからない」というのでは、せっかくのデータを価値に繋げることができない。

 結局のところ知りたいのは「統計的に信頼できるレベルで、収益性の違いをよく説明する説明変数」なのであり、本書で説明する重回帰分析の使い方であれば、候補となる説明変数が数十あろうが数百あろうが、統計的に信頼できるレベルで収益性と関連するものだけを見つけることが可能である。

 また2つめの問題点は、単純な集計で見つけた違いが本当の原因かどうかはわからないという点である。たとえば図表1‐?15を見れば「営業力の強さによって収益性が左右される」という結論が導かれるが、単にある程度大きな売上をあげている企業が有り余るキャッシュを使って強力な営業力を強化しているだけかもしれない。

 つまり、本来重要なのは、「売上があると規模の経済が働いて収益性があがる」というだけの話であり、実際のところある程度の規模さえあればたいした営業をかけなくても収益性は向上する、という状況も考えられるのである。この場合、「売上の大きいところは収益性も高いし、たいていの場合営業も(ある意味ムダに)強い」ということになり、見た目上は「営業力が強いところは収益性も高い」というグラフが得られてしまう。しかしながら、だからといって売上の小さな会社が無理をして営業力を強化したところで、収益性はたいして改善しないかもしれない。

 だが重回帰分析のような多変量解析手法は、「他の説明変数の条件が一定だったとすれば、この説明変数が1増えるごとに総資本利益率はいくつ増えるか/減るか」という形で結果を示すことができる。

 先ほどのような状況で、売上高と営業力の強さの両方を説明変数として含めておけば、「営業力の強弱という条件が同じだったとしても売上高が増えると収益性は高くなる」とか、「売上高の条件が同じだったら営業力の大小自体は収益性とほぼ関係しない」といったことがわかるのだ。

 こうした特徴により重回帰分析は単純な集計グラフよりはだいぶミスリーディングな結果を回避することができる。

ステップワイズ法と人の目による変数選択

 そうした集計グラフの限界を回避できる、というメリットから重回帰分析を使うことになるわけだが、注意が必要なのは、分析対象とする企業の数よりも、説明変数の数は少なくなければならないという点である。

 経営戦略分析のため自社と競合する企業をリストアップしてみたとき、しばしば起こるのが分析対象となる企業数がせいぜい30社ほどしかない、という状況である。30社しかないから分析できない、ということはまったくないのだが、仮にこの30社に対して100の説明変数を全て使った重回帰分析を行なうことは数理的にできないのである。

 説明変数の数が29(分析対象の数より1小さい)の時点で、中学生が連立方程式を解くように、誤差も何もなく「完全にデータと一致する関連性」が導かれてしまい、それ以上の数の説明変数はどうやっても考慮できないのだ。

 そのため、具体的に企業数がいくつなら、説明変数がいくつまで、という基準が明確に存在しているわけではないが、経営戦略を考えるためにせいぜい20〜30社程度の企業を分析対象とする場合には、統計的によく信頼できて収益性への影響が大きい説明変数を数個だけ用いたような重回帰分析の結果が望ましい。

 ではどのようにしてこのような説明変数を見つければよいのだろうか? これも統計手法の仕事である。専門用語では変数選択と言うが、どれだけ説明変数の候補があろうが、その中から統計的に信頼できる説明変数だけを選び出した重回帰分析の結果を得る、という機械的なアルゴリズムが存在しているのである。

 たとえばSAS、R、SPSS、あるいはStataといった統計解析ツールによって一般的に提供されているものの中でおすすめなのは、ステップワイズ法と呼ばれるアルゴリズムである。ツールによって、あるいはその中で設定するオプションなどによっても多少の違いはあるが、基本的な考え方として、ステップワイズ法ではまず複数の説明変数から1つだけの説明変数を使った回帰分析を行ない、最も優秀なものを探す。

 次に、残りの説明変数から、最初に選ばれた(最も優秀な)説明変数1つと組み合わせた重回帰分析を行なったときに最も優秀な説明変数は何かを探す。

 このように説明変数を1つずつ追加していく一方、一定の基準で逆に削除すべき説明変数がないかをチェックし、あれば削除する。こうした説明変数の増減を繰り返し、これ以上基準を満たす追加すべき説明変数も削除すべき説明変数も見つからないというような状況になれば探索を終了する。

 こうして最後に選出された説明変数による重回帰分析の結果を見れば、それが自分たちの用意したデータから導き出される、「収益性と関連する重要な説明変数」ということである。

 なお、ふつうのビジネスマンが分析するのであれば「とりあえずステップワイズ法で十分」というのが私の考えであるが、最近ではこうしたステップワイズ法よりも、スタンフォード大学統計学専攻のティブシラーニ教授によって1996年に開発されたラッソ正則化あるいはその派生形のような手法による変数選択のほうが望ましい、という考え方も広がっている。興味があれば彼が共著に名前を連ねる専門書の邦訳『統計的学習の基礎  データマイニング・推論・予測』(共立出版)の中でこうした手法の説明がなされているので、読んでみてもよいだろう。

 そうした手法よりも実用上重要になってくるのは、「当たり前すぎる説明変数が変数選択されていないか」という結果のチェックである。

 たとえば帝国データバンクから受け取ったデータをもとに分析用データを揃えたため、うっかり営業利益の数字を説明変数の候補として残してしまっていたとしよう。営業利益の金額が増えれば総資本利益率が増えるのは当たり前の話であるが、これが重回帰分析の説明変数として選択されているということは、それ以外の説明変数と総資本利益率との関連性を示す結果は全て「もし営業利益額が同じだとしたら〜」という条件を揃えられてしまったうえでのものである。これは非現実かつ意味のない仮定であり、要するに本来知りたかった「どのような要因が収益性と関連するのか」という結果が歪められてしまうのだ。

 あるいは「当たり前」というほどでなくても「それがわかってもどうしようもない」「何か気持ち悪い」みたいな説明変数が選び出されていた場合、試しにそうした説明変数を削除したうえで変数選択をやり直す、というのも大事なポイントである。

「どうしようもない説明変数の条件が一定だったら〜」という条件の調整があろうとなかろうと、同じような説明変数が選び出される場合、その結果はかなり信頼できるが、一方で「どうしようもない説明変数」を除外することで、新たに別の重要な説明変数が見つかるかもしれないのである。

 どんな高度な手法であれ、基本的に数学やアルゴリズムは「最も当てはまりが良いように」分析結果を得ようとする。だからこそ逆に、「そりゃ当てはまりはいいだろうけど意味ないだろう」というようなツッコミをするという人間の仕事が価値を帯びるのだ。

分析の解釈の実例と基礎知識

 機械的なアルゴリズムと、人間の目でのチェックを駆使し、こうした説明変数の取捨選択を一通り終えることができれば、数個のある程度それらしい説明変数によって総資本利益率の差が説明できる重回帰分析の結果が得られるはずだが、分析をして終わり、ということはない。

 むしろこの後の、分析結果を解釈して何を行なうか、という点こそがビジネスにおいては価値を生むはずである。たとえば図表1‐16のような結果が得られたとしたらどのように考えればよいだろうか?

 変数選択の結果、「統計的に信頼できる」し「当たり前でも変でもない」という説明変数には、「東南アジア圏への進出あり」「営業力の強さ」「保持特許数」、それと市場調査の結果得られた「商品の開発力が高い」「広告にセンスがある」「サポートが弱い」と思われているかどうか、という6つが選ばれてきたようである。

 これは一見すると当たり前なようだが、もし説明変数の候補としてこれ以外にも「売上高の規模」や「特定の商材を扱っているかどうか」「取り扱う商品のお買い得さに対する市場の意識」といったデータを用意したうえでなおこの6つが選ばれたのだとすれば、拡張路線で規模の経済を追求するとか、どこかの市場に参入するとか、ディスカウント攻勢をかけるといった戦略よりも、この6つの説明変数を強化する方向へ注力したほうが筋の良い戦略ではないかという期待が持てる。

 回帰係数(細かく言うと偏回帰係数だが本書ではわかりやすさを重視するため単に回帰係数と呼ぶ)とは「説明変数が1増えるごとに/何らかの条件に該当する場合にどれほど総資本利益率が増えるか/減るか」という意味である。この回帰係数はあくまで今回用いたデータから推定されたものであるため、同じ状況でもう一度調査と分析を行なった際にも再び同じ結果が得られるとは限らない。しかし、だからといってまったく信頼できない、ということはない。それぞれの回帰係数の横にある95%信頼区間を見れば、無制限にデータを集めた結果わかるはずの回帰係数は「だいたいこのへんにあるはずだ」という範囲がわかる。この95%信頼区間の両端がともにプラス、あるいはともにマイナスである場合「まったく総資本利益率と関係がない(回帰係数がゼロ)」あるいは「むしろ逆効果(回帰係数の正負が逆)」ということは考えにくく、同じことはその横のp値からも判断できる。

 p値とは、(他の説明変数の条件を一定としたとき)その説明変数がアウトカムに本来であれば何の影響も与えない場合に、データのバラツキだけでこれほどの回帰係数が偶然得られる確率を示している。すなわち、p値は小さいほど信頼できそうという結果であり、一般的には5%を下回るかどうかという基準が用いられる。

 図表1‐16からわかるのは、たとえばいくつもの競合企業のうち、東南アジア圏への進出をしているかどうか、という1点の違いのみで平均して1.22%も総資本利益率が異なるということである。また、p値を見ても0.049と、一般的な判断基準である0.05よりも小さい。これはつまり、「データのバラツキや誤差だけでこれほどの差が偶然出てくる確率は5%よりも小さいから信頼してもよいのではないか」という結果である。さらに、95%信頼区間を見てみると、誤差を考慮したうえで最低でも0.01%、最大で2.43%の利益向上が期待される。

 これは一見するとたいした数字には思えないかもしれないが、上場企業はもとより、そうでない企業においても、バランスシートを見れば総資本何十億〜何百億円といった企業は日本に数多く存在している。また、一般によく知られているような大企業であれば数千億円や数兆円以上といった資産を当たり前のように持っている。

 仮にあなたの企業が1千億円の総資本から30億円の利益を出していたとすれば総資本利益率は3%ということになるが、これがもし1.2ポイント増えるような説明変数が見つかり、その方向へ企業を変化させることが不可能ではない(今回の場合で言えばまだ東南アジアには進出してなかったが今後進出する)とすれば、あなたは毎年12億円ほど、会社を今より儲けさせるアイディアにたどり着いたということだ。

 この他の説明変数についても見てみよう。第三者に4段階評価で尋ねた営業力の強さという説明変数については、1段階評価が上がるごとに0.47%ずつ総資本利益率が高い傾向にある、という結果が出た。もし自社がまだ4段階目の最高評価に達していないとすれば、1段階上げれば0.47%分、もし現在自社の営業力が弱いと評価されている状態から頑張って2段階上げることができるのであれば、その倍の0.94%分も収益性を改善できるのではないか、という状況である。

 一方、保持している特許数という点では、1件増えるごとに0.02%分とかなり小さめな値だが、特許数は4段階評価などよりはるかに大きなレンジを持った値である。まったく特許など持っていない企業から、トヨタ自動車や東芝といった大きな製造企業になると毎年数千というレベルで新たな特許を出願している。さすがにいきなりそこまでは無理かもしれないが、仮に研究開発を頑張って50件ほど価値を生む特許を取得することができれば、それも平均して1%分の収益性の向上に繋がるかもしれない、と解釈されるのだ。

 なお、分析対象とした企業数が限られている場合などは一般にp値は大きくなりやすい傾向にあり、この説明変数でもp値が0.05より大きく、95%信頼区間を見ても、「ひょっとすると特許が多いほうが、 -0.01%とわずかながら利益率が低いのかもしれない」と読み取れる。5%を下回るかどうかという統計学的な慣例のみに基づけば「データのバラツキで偶然得られた回帰係数かもしれない」と考えるところだが、もし気になるようであれば今度はより多数の企業データを用いて、特許と総資本利益率の関係を検証してみるといいだろう。

 このほか、顧客の意識としてはありとあらゆる項目の中で「商品の開発力が高い」「広告にセンスがある」「サポートが弱い」と思われるかどうかについて、1段階評価が良くなるごとに0.2%〜0.3%ほど総資本利益率が上下しうる、という結果が示唆された。こちらもおそらく今後注力すべき方向性を指し示しているだろう。

 なお、説明を飛ばした切片とはこの表にある全ての説明変数がゼロという値をとるとき、総資本利益率は何%になると考えられるか、という値を示している。

 こうした分析ではしばしば「説明変数がゼロという値をとるものではない」ため解釈が難しいが、仮に東南アジアに進出せず、特許もまったくなく、営業力も商品開発力も広告センスもサポート体制も4段階中最低評価(1点)という企業があったとすれば、

 という計算から、おそらく総資本利益率は0.26%程度であろうと見積もられる。このほかもっと条件が良い企業においても、切片の値とそれぞれの説明変数の値および対応する回帰係数の値を用いて同様に「平均的にはどれぐらいの総資本利益率になるだろう」ということを見積もることができるのである。

詳細な分析手法と、それをおすすめしない理由

 なお、より詳細あるいは妥当な分析を行なうために、同じ重回帰分析を行なうにしても検討すべき工夫というのもいくつか存在しているので、そちらについても紹介しておこう。

 たとえば売上高や従業員数は、業界の中でも大きい企業は他と比べて桁違いに大きいが、いくつも小さい企業がドングリの背比べのようにひしめいている。こうした状況のデータについては、「対数をとる」という作業を行なったうえで分析に用いたほうが当てはまりが良いこともある。

 高校で習う底が10の常用対数をとるのであれば、売上高が100万円ならこれは10の6乗なので6という値になり、1億円ならこれは10の8乗なので8という値になる。こうすると「桁違いな大きさ」による影響がマイルドになるため、しばしば良い結果が得られるのである。

 あるいは、説明変数を二乗した値(これを二乗項と呼ぶ)も分析に含めるということも考えられる。先ほど特許数が1増えるごとに収益性が上がるという結果について述べたが、特許数が1増える価値は現在保有する特許が少ない企業と多い企業、どちらにおいてもほぼ同じなのだろうか? それとも保有数が多ければ多いほど追加的な特許の効果もさらに増大するのか? 逆に一定以上特許を持っている状態なら、それ以上特許を増やしてもあまり効果はないのだろうか? こうした疑問に二乗項を用いれば答えられるのである。

 さらに「商品開発力がある場合には営業力の重要性は相対的に低下するが、商品開発力がない場合、営業力が生命線になる」といった説明変数同士の組合せについても疑問が生じるかもしれない。このような問いは「4段階評価の商品開発力」と「4段階評価の営業力」に加えて、「商品開発力と営業力の値を掛け合わせた値」(交互作用と呼ばれる)を説明変数に加えた分析によって答えることができる。なお、こうした工夫は、後の章で述べるロジスティック回帰においても同様に行なうことができる。

 しかしながら私はあまり、最初からこうした細かい検討をすることはおすすめしない。なぜなら先ほど見せたような重回帰分析の結果と比べて、格段に結果の解釈がわかりにくくなるからだ。

 対数とか二乗といったものは中高生が習う数学的な概念ではあるが、聞いた瞬間に頭がフリーズする大人もしばしば存在する。交互作用を正確に理解しようとすると、表を書いて場合分けの整理が必要になるものもあるが、これもそこそこややこしい。

 もちろん興味があればこうした詳細の検討はぜひしてもらえばいいし、大学生向けの統計学の教科書ではこのあたりをよく説明しているものも数多く存在している。だが大学の授業とは違い、ビジネスマンが統計学を使う理由はその結果を活かして何らかのアクションを起こし、儲けるためである。そのためには多くの人を説得したり調整したりせねばならず、ストレスになりそうなところがあるのであればできるだけ取り除いておいたほうがいい。桁違いに大きい企業のせいで結果の解釈が難しくなるようであれば、そうした企業を除外して再分析してみてもよいのである。

厳密な検証よりも、素早い小規模なアクションを

 また、厳密に考えればこれら6つの説明変数の背後に何か別の要因が隠れているのではないか? という可能性は単純集計のときと同様、完全に拭いさることはできない。さらに、東南アジアに進出したから収益性が高いのか、収益性が高いということによって生じる資金的な余裕によって東南アジアに進出することができたのか、といったように、どちらが原因でどちらが結果か、という因果関係の向きについても厳密にはわからない。

 ミスリーディングな分析結果で誤ったビジネス上の意思決定をしないよう、こうした「背後に何か隠れていないか」「因果関係の向きはどうなっているのか」という点について、業務知識のある関係者で議論することはもちろん重要である。

 しかしながら、いくら高度な手法であれ、どれほどのビッグデータであれ、どれだけ専門家同士で頭をつきあわせて議論したところで、厳密な因果関係というものを実証しきることはできない。それができるとすれば、ランダム化比較実験あるいはA/Bテストと呼ばれるようなやり方だけが唯一のものである。

 たとえば自社製品の説明書を2種類用意する。一方は従来通りの説明と従来通りのサポート窓口を提供するもの、そしてもう一方は注意深くデザインされたわかりやすい説明と、新たに契約した手厚いサポートを提供するコールセンターへの連絡先を提供するもの。同梱される説明書が違う以外はまったく同じ製品をまったく同じパッケージに詰め、調査に協力してくれるモニターをランダムに半々に分け、一方のグループには手厚い説明書の商品を、他方のグループには従来通りの商品を渡す。

 一定期間経過した後このモニターに調査を行ない、もし手厚い説明書を渡されたグループが何らかの点で、統計的に信頼できるくらい明確(つまりp値が0.05を下回るくらい)かつ、コストにマッチする水準で自社の利益に繋がる行動(たとえば無料で提供していない他の商品を自腹で購入、など)を取っていたのだとすれば、「サポート体制を強化する」という戦略は機能するはずであるという因果関係が実証されたことになる。

 ランダムに選ばれたということは、平均的には両グループに何の違いも存在しないはずだが、たった1つ、説明書とサポート窓口の手厚さという違いによって明白な利益の差が生じたということは、因果関係と考えてもいいだろう。このことはおそらく統計学に関わる者であれば誰でも同意するところである。

 もし、あなたやあなたの会社に、対数や二乗項、交互作用などの検討を含む十分な分析を行なうケイパビリティがあるのであればそれはたいへん素晴らしいことである。しかしそうでないのであれば、小手先の手法や関係者の「慎重な議論」で分析結果をどうこう考えるよりは、とりあえず何かしらのアクションを、小規模にでもいいから試してみたほうがいい。分析のスキルだけでさまざまな説明変数とアウトカムの関連性を正確に見積もろうとすると専門的な知識が必要になるが、A/Bテストで検証すべきアイディアを探索するだけなら本書のような枠組みだけでも十分機能するのである。

 不完全な分析であっても、たとえば「30億円儲かりそう」と示唆された結果をいつまでも活かせない状態でいることと、「数千万円ぐらいはその検証のために投資してみるか」とアクションを取り始めることでは、果たしてどちらのほうが賢明なのか、ぜひ考えてみてほしい。