業績アップの方法を探るデータ分析

写真拡大

■仮説思考

不振店舗のテコ入れか。まずは原因を分析しないと……

----------

【STORY】
担当販売店の売り上げアップを評価され、地域全体の統括責任者へ昇進することになったあなた。「君が統括する地域で真っ先にテコ入れすべき店舗はどこか。どうすれば売り上げを改善できるか。考えを聞かせてくれ」。社長室で最初の仕事が告げられた。期限は1週間後。さあ、どうする?

----------

新規ビジネスを考えたり、トラブルを解決しようとするとき、データ分析のスキルがその成果を大きく左右します。特にマネジメントの立場にある人には、必須スキルといえるでしょう。

今回のケースでは、地域全体の統括責任者に昇格し担当が複数の店舗に増えると、各店舗についてその店長と同じ深さで把握することは難しくなります。

ある程度は経験や勘に頼る部分はあっても、社長の承認を得るためにもデータに基づく客観的な分析と提案が必要です。しかし、最新の分析システムを使い、時間をかけて答えを探せる環境にいる人はとても少数。通常の実務現場にいる人は、分析を短時間に効率的かつ効果的に進めなければなりません。

そこで重要になるのが「仮説を立てる」ことです。分析に入る前から課題に直結する仮説をしっかり立てておくと、分析の途中で目的を見失ったり、無駄な回り道をしたりする事態を避けられます。

仮説アプローチは課題と分析とをブリッジする役目を果たします。つまり、課題から次の一歩に踏み出せない状況や、いきなりデータ収集から入ってさまざまなデータに翻弄されるような「よくある事態」への有効な処方箋になるのです。

【課題と分析をつなぐ仮説を立てよう】

データに基づく客観的な分析と提案を導き出すためにも、データ分析を始める前に仮説をしっかり立てることが重要。目の前の課題に直結する仮説を立てることで、分析の途中で目的を見失ったり、無駄な回り道を避けたりすることができる。課題につながる複数の要素を仮説として設定し、その当否を分析によって検証していこう。

課題につながる複数の要因を仮説として設定し、それぞれの仮説が正しいか否かを分析、検証します。

まずは、現状把握からスタートし、その結果から深掘りすべきポイントを絞って、要因や対策を探るという一般的な課題解決のプロセスを通して考えてみましょう。

まず担当地域のなかで売り上げの減少が顕著に続いているA店に焦点を当て、課題である売り上げを因数分解します(下図)。売り上げを構成する要因はほかにもありますが、ここでは顧客の年齢層に課題ありという仮説にフォーカスして話を進めます。

これにより、各年齢層における来店者数の推移や、週による来店者数のバラつきから、安定した集客への課題のポイントを特定できるのではないかという仮説が立てられます。すると、必要になるのは年齢層ごとの来店者数データとなります。

【仮説を検証するためのデータを集めよう】

●売り上げ構成図
まずは、売り上げの減少が続いているA店の課題である売り上げ構成要素を分解してみる。構成要素は様々あるが、今回は「年齢層に分けて来店者の推移を見ることで、対策をとるべき年齢層と課題が発見できるのではないか」という仮説を基に構成図をつくることにした。

●平均来店者数
仮説と構成図を基に、年齢層(横軸)ごとの過去30週分の来店者数データを集めた。AVERAGE関数を使って30週を通した平均来店者数を出した結果、平均的には21〜35歳の来店者数が最も少なく、51歳以上が最も多いことがわかった。しかし、これは30週通してのどんぶり勘定的な「大きさ」を把握した程度。意思決定につなげるには時期尚早だ。

----------

POINT●課題解決の道筋
1 現状把握
2 深掘りすべきポイントを絞る
3 要因・対策を練る

----------

■現状分析

----------

課長「不振店の原因となっている年齢層ってどこなんだ?」
 ⇒平均値を調べたものの、原因は本当にそこなんだろうか?……

----------

データの特徴を把握するには「大きさ」と「バラつき」の2つの視点が大切です。このケースでの「大きさ」とは来店者数、「バラつき」とは週ごとの来店者数のバラつき度合いです。

まずは、年齢層ごとの週別来店者数データの過去30週間分を用意し仮説を検証しましょう。おそらく多くの人が行うのは、年齢層別の週当たり平均来店者数の比較でしょう。下の表の結果を見ると最も低いのは21〜35歳層ですが、この層に問題があると結論付けるのは早計です。30週分のデータすべてをどんぶり勘定にした数値だけで、意思決定してはいけません。平均値だけでなく30週での推移を見ることで、これまでの傾向や今後の予想がつきます。

そこで5週間ごとに平均をとり、グラフで可視化してみましょう。すると、21〜35歳層は絶対数は少ないものの、やや上昇傾向にあり、扱いには慎重になるべきことがわかります。

それより気にかかるのは36〜50歳層の乱高下、つまり「バラつき」です。来店者数に比例し売り上げの振れ幅も大きくなり、経営リスクが高くなります。

【時間の推移で平均値を見てみよう】

今度はさらにデータを細分化し、5週ごとの平均来店者数の推移を見てみる。これにより、さらに詳細な来店者層の傾向を把握することができる。前回の30週分の来店者数表を基に5週ごとの平均値を割り出した表からグラフを作成する。

推移を見るのに適した折れ線グラフにしてみると、21〜35歳は絶対数は少ないがやや右肩上がり傾向にあることがわかった。一方、36〜50歳は30週全体での平均値は最低ではないものの、時期による乱高下が目立つ結果となった。

バラつきを見る方法として、ここでは変動係数とヒストグラムを紹介しましょう。

変動係数とは、データのバラつき度合いを示す標準偏差を平均値で割ったものです。

標準偏差とは、それぞれのデータが平均からどの程度離れているかを示した指標。標準偏差が大きいほど平均から離れた値にまでデータが存在しバラつきが大きく、小さいほど平均値周辺に多くのデータが集まりバラつきが小さいことを示します。

ただし、一般的に標準偏差は基のデータの大きさの影響を受けます。1日あたりの平均売り上げ1000万円の店舗と100万円の店舗の標準偏差が同じ30万円でも、同じ意味をなしません。そこで、比較する場合は変動係数を使うのです。

【標準偏差と変動係数で振れ幅を測ろう】

まずはデータのバラつき度合いを示す標準偏差を求めよう。36〜50歳の来店者数の標準偏差を求める場合、STDEV関数を使って下表のように算出される。標準偏差を平均来店者数で割った値が変動係数。数値が大きいほどバラつきがあることを示す。36〜50歳は、ほかの年齢層に比べ振れ幅が著しく大きいことがわかった。

標準偏差
……それぞれのデータが平均からどの程度離れているかを指標にしたもの

=STDEV(データ範囲)

変動係数
……標準偏差を平均で割り、データの大きさによる影響をなくしたもの

ヒストグラムは縦軸にデータの数、横軸にデータの大きさの範囲をとった棒グラフで、バラつきを可視化させたものです。算出した変動係数とヒストグラムからは、36〜50歳層は平均値が最低ではないものの、他の年齢層と比べ振れ幅が著しく大きいことがわかります。この店舗の改革はこの年齢層の扱いが焦点になりそうです。

【ヒストグラムでバラつきを可視化しよう】

次はヒストグラムでバラつきを可視化してみよう。最初に度数分布表を作る。上図では横軸に年齢層、縦軸に来店者数を設定し、来店者25人ごとの週の頻度を算出。たとえば36〜50 歳で201人以上225人以下の来店者があった週の頻度を求める場合、標準偏差の項で使った上図から範囲を指定し、左上表のように関数を入力。この方法ですべての数値を求めて表が完成したら、棒グラフ化。棒の間隔をゼロにすれば、右上のようなヒストグラムが完成。

ヒストグラム
……データの数を棒グラフで示し、大きさのバラつきを可視化する方法

=COUNTIFS (データ範囲,最初の条件,もう1つの条件)

 

■複雑なシミュレーション

----------

課長「36〜50 歳向けにイベントを行って、もっとしっかり顧客を掴むんだ!」
 ⇒イベントにいくら費用をかけたらどれだけ集客できるのか……

----------

前項では「36〜50歳層の集客を十分にコントロールできていない」ことがわかりました。早速、改善策を考えてみましょう。

来店者数を左右する多くの要因のなかから、ここでは集客イベントの費用を主な要因として分析していくことにします。

来店者数とイベント費用など、2つのデータの関係の強さを示す統計指標に相関係数があります。相関係数は常にマイナス1からプラス1の間の値をとり、0に近いほどお互いの動きの関連はなくなります。この相関係数を導き出し、2つのデータの結びつきの強さを分析するのが相関分析です。一般的に相関係数が0.7以上、マイナス0.7以下であれば強い相関があると考えられます。

下の相関分析の結果を見ると、21〜35歳層はイベント費用を使ったときに多くの来客がある一方、36〜50歳層にはイベント効果が見られません。

以上に基づき対策を考えると、新たに36〜50歳層に向けた商品などを投入し底上げする案か、最も来店者数が多く、従来の方法で集客を見込めそうな51歳以上の層をメーンターゲットにする案が考えられます。

【イベント費用と来店者数を相関分析しよう】

来店者数とイベント費用など2つの相関関係の強さを探りたいときには、相関係数を使う。CORRELという関数の後に2つのデータ範囲(下図の場合は(A)と(B))をカンマで区切って入力。相関係数が+1に近いほど相関の強さを示すため、この結果から36〜50歳はイベント費用をかけても来店者数が増えていないという事実が明白となった。

相関係数
……2つのデータ間の関係の強さを示す統計指標

=CORREL (データ範囲,データ範囲)

相関分析から2つの選択肢を考察

----------

36〜50歳層の底上げを図るため、新たにこの層を対象にした商品投入などをしつつも、すべての層をねらった店舗を継続していく

----------

↓コチラを選択

----------

現状、来店者数が一番多い51歳以上の層をメーンターゲットとして、店舗自体のコンセプトを仕切りなおす

----------

ここでは後者の案を採用したとして、どうすれば51歳以上の層からより多くの来店者を獲得できるかを考えてみます。

まず、この年齢層ではイベント費用と来店者数の間にどんな数値関係があるか、左下図1のようにExcelで散布図にします。

次に右下図2の手順で直線と数式を表示します。これらは2つのデータの相関、すなわち比例関係を表したもので、Y=aX+b(a、bは定数)の形で示されます。つまり、数式は来店者数=0.2706×イベント費用+150.08と読み替えられ、イベント費用をどれだけかけると、何人の来店者が見込めるかを過去のデータから導き出したものです。

この式を使えばイベントの予算に対する来店者数予測やその逆も割り出すことができます。この分析方法を単回帰分析と呼び、一定の相関が見られるデータであればすぐ実施できる優れものです。

こうして仮説を立て様々な数字を見ながら分析していくことで、赤字事業を改善したり、新たなビジネスを成功させたりすることができるのです。

【単回帰分析を使って解決策を導こう】

(図1)
相関分析の結果からイベントのターゲットとして定めた51歳以上の範囲だけを相関関係表(右ページ表)の中で指定し、「グラフ」から「散布図」を選び作成。すると、散布図から右肩上がりの傾向(相関)が読み取れた。

(図2)
さらに右クリックして「近似曲線の追加」を選択し、「近似曲線の書式設定」から「グラフに数式を表示する」をチェックすると、分布図の中に直線と数式が現れる。近似曲線とは2つのデータの比例関係を数式化したもの。この数式によって2つのデータの関係性を数値化することを単回帰分析と呼ぶ。

----------

単回帰分析
2つのデータ間の相関関係を数値化すること。相関性の高いデータに有効で、比例関数を表した数式が導き出される。

----------

[これが正解!]
⇒過去のデータから、解決策実現の根拠を発見!

現れたY=0.2706X+150.08という数式は、「来店者数=0.2706×イベント費用+150.08」という意味を表す。どれだけのイベント費用をかけると何人の来店者が見込めるかという理論上の予測だ。これを使えば、目標とする来店者数実現のためのイベント費用の予算を立てられ、より説得力のある解決策を実行できるようになった。

----------

データ&ストーリー代表横浜国立大学非常勤講師 柏木吉基
1995年、日立製作所入社。米国でMBA取得後、2004年より日産自動車で多くの改革プロジェクトを率いた経験と実績を強みに、実務データ分析の講師として14年独立。

----------

(データ&ストーリー代表 横浜国立大学非常勤講師 柏木 吉基 構成=宮内健 、岩辺みどり)