統計学と機械学習を支える数学が、 「全く一緒」と言えるわけ

写真拡大

ビジネス書大賞(2014)、統計学会出版賞(2017)を受賞し、累計48万部を突破した大ヒットシリーズの最新刊『統計学が最強の学問である[数学編]』が発売されました。

著者の西内さんは、統計学の数学を学べば、人工知能の重要技術である機械学習の数学もマスターできるといいますが、そのわけは…?

数学者アーサー・ベンジャミンの主張

 アメリカの数学者アーサー・ベンジャミンはTEDトークなどの場で、「高校までの数学教育では微積分などより統計学を教えるべきである」と主張しています。

 理工学系の学生にとって、確かに微積分は重要です。しかし、それ以外の一般的な人々が日常生活で使うことはほとんどありません。それよりも統計学の方が、全ての人が日々使うものだという理由から、彼はこのような考えに至ったのだそうです。

 私はこの話に対して、賛否両方の意見があります。賛成する点はもちろん「統計学は全ての人が学ぶべきものである」という彼の考え方です。

 たとえば、文系の学問を身につけてホワイトカラーな仕事をするにしても統計学は役に立ちます。営業、マーケティング、人事といったさまざまな領域で、きちんとデータと統計学を活かせば、数%程度の売上増やコスト減に繋げることもそう難しいことではありません。

 また、理系の学問を身につけてエンジニアになるにしても統計学は大きな意義を持ちます。製造業における生産性や品質の向上といった分野、あるいは仕入れや生産の最適化といったことを考えるときにも、統計学はとても役に立ちます。

 さらに言えば、ビジネスと関係のない分野においても、統計学を学ぶことは大きな価値を持ちます。医療、福祉、教育、防犯、環境問題など、私たちの生活に関わるさまざまな社会課題について、統計学的な視点をもってすれば、「どうすれば効率的に解決できるか」「今行なわれている政策は妥当なものだと言えるのか」ということが判断できるはずです。こうした統計学の持つパワフルさについては、私が日々自分の仕事を通して実感し続けるとともに、初代『統計学が最強の学問である』から一貫してお伝えしてきたところです。

 しかしながら、私がベンジャミンの主張に対して手放しで賛成できないのは、統計学の中でも微積分はとても重要な役割をこなしているから、というところにあります。私自身、高校や大学の教養課程までの数学をきちんと教えていただいたからこそ、統計学の学習がスムーズだったのではないかという気もします。また最近の仕事では、論文が公表されたばかりの新しい機械学習手法などを使うこともありますが、その際私が特にストレスを感じることもないのは、微積分や線形代数といった「理工系の共通言語」を理解しているおかげだと言えます。

「ITと統計学の素晴らしき結婚」で
生み出されたもの

 では、高校までの数学教育はどのようにすればよいのでしょうか?

 私の個人的な考え方は「統計学と機械学習の専門的な勉強がはじめられることをゴールとして、高校までの数学のカリキュラムは再編成されるべきである」というものです。

 統計学に加えてここで突然機械学習の話が登場したことに驚いた方もいらっしゃるかもしれません。「統計学と機械学習」あるいは「統計学と人工知能」と言われると、多くの人がなんだか全く別のもののように感じるはずです。しかし、実はその背景にある数学的な道具立ては「全く一緒」と言っても過言ではありません。

 初代『統計学が最強の学問である』では、この20年ほどで統計学がとんでもなくパワフルになった理由として「ITと統計学の素晴らしき結婚」という表現をしました。多くの人が大学の教養課程で習う「紙とペンの統計学」が、コンピューターサイエンスという強力な伴侶を得たことにより、現実的な問題の意思決定に際して大きな力を持つようになったわけです。しかし、この結婚によって生まれたのは「現代的な統計学」だけではありません。もう1つ「現代的な人工知能」というとてもパワフルな兄弟をも産み落としました。

 1950年代にはじめて「人工知能」という言葉が使われるようになってからの第一次人工知能ブーム、そして1980年代の第二次ブームのそれぞれで、人工知能研究の主流は「コンピューターに人間の持つ論理や知識を教え込むことで知能を生み出せるのではないか?」という考え方でした。当時のこうした考え方に基づき書かれた人工知能研究の論文や書籍を見てみると、そのほとんどは記号論理学のような話ばかりが記述されており、統計学とは全く別の分野であると言えます。ただし、こうした「人間がコンピューターに論理と知識を教え込む」というやり方は行き詰まりを見せ、これら二度の人工知能ブームは廃ってどちらも冬の時代を迎えました。

 一方で少なくとも1960年代の終わり頃からちらほらと、一部の人工知能の研究者たちは「確率」や「データへのあてはまり」といった統計学の概念を取り入れはじめます。たとえばディープラーニングは専門的には「層の数がとても多い(ディープな)ニューラルネットワーク」であると表現されますが、実は世界に先がけて多層ニューラルネットワークによる画像認識を研究した日本の甘利俊一は、ニューラルネットワークに統計学のような確率や微分といった考え方を持ち込みました。こうした「データとデータの間の最もあてはまりのよい数学的な関係性を推定する」という統計学的な考え方は、現代のディープラーニングの中でも大きく役に立っています。

 話をまとめると、「ITと統計学の素晴らしき結婚」によって次の2つがこの世に生み出されたということです。

 1つは統計学において、紙とペンの手計算だけでは難しい分析がコンピューターによる計算アルゴリズムで実現できるようになりました。これが「現代的なITによる統計学」です。一方で、コンピューターサイエンスの世界で生まれた人工知能研究においても、記号論理学のような理屈や知識表現だけではうまくいかなかったことが、統計学の理論と計算方法によって実現できるようになりました。このようなクロスオーバーが、現代のデータ社会の中でとても大きな力を発揮しているのです。そしてそれゆえに、統計解析手法と機械学習手法を数学的に記述するやり方は、細かい慣例などの違いこそあれ「基本的に全く同じ」というわけです。違いがあるとすれば数学的な理屈の後の、「どういうアルゴリズムでコンピューターを働かせるか」という部分ぐらいでしょうか。

 そうすると、いまエンジニアたちが統計学と機械学習の背後にある数学に慣れておくことは、前述のような品質の向上や、生産計画の最適化に使うという以上の意味を持ちます。蒸気やガソリンを使ったエンジンを使いこなすために熱力学を理解するとか、電子部品を使いこなすために電磁気学を理解する、といったのと同じようなレベルで、これからのものづくりにおいてその競争力の少なからぬ割合が、機械学習技術をどう活かすか、というところと関係してくるからです。

 そんなわけで本書はこれからの時代の全ての大人にとって必要な、統計学と機械学習を勉強するための素養となる数学について説明していきたいと思います。

いまの数学教育は、
「理工系の専門家になるためのピラミッド」

 前述のベンジャミンによれば、高校までの数学カリキュラムは「微積分を頂点とするピラミッド状に積み上げられている」とのことです。微積分を理解するためには関数やxy平面上のグラフの概念を理解しておかなければいけません。そしてこれらの概念を理解するためには、「数をxやyといった文字で表す」といった考え方を身につけておかなければいけません。このように、より基礎的で使う範囲の広い知識から少しずつ積み上げて、最終的に「微積分が理解できる」という頂点に至るのが、彼の言う「ピラミッド状」ということなのでしょう。

 そしてこのピラミッドの頂点にある微積分が、彼の言うように「理工系の専門家だけのためのもの」であるとするならば、アメリカでも日本でも、子どもたちは小学校入学から高校卒業までの長い期間をかけて、「理工系の専門家になるためのピラミッド」を積み上げていることになります。

 しかし、このピラミッドのほとんどは完成せず、どこかの部分でつまずいたまま放置されて、数学の苦手な大人が多数輩出されていくというのが現状なのではないでしょうか。

 私は統計学が、現代人にとって「読み書きそろばん」の「そろばん」にあたるほど重要なスキルであると、昔から主張してきました。200年前なら、一国に住む人間のうちどれだけが「そろばん」をできるかというところが経済を円滑に回し、また価値あるものを設計したり量産したりというところを大きく左右してきたのでしょう。それと同様に、現代においては統計学と機械学習を使いこなせる人間がどれだけいるかというところが、組織や社会の生産性を改善し、価値ある製品やサービスを生み出すことを通して国力を大きく左右するのではないかと思います。

 ではどうすれば、もっと世の中の多くの人が統計学と機械学習を理解し役に立てられるのでしょうか?

 この問題に対して、私が本書で提示する答えは、高校までの数学の内容を編み直し、大幅に削減した上で「統計学と機械学習を頂点とした数学教育のピラミッド」を作ろうというものです。

 本書では微積分も扱いますが、徹頭徹尾、統計学や機械学習を理解する上で優先順位が低いと考えられる内容については言及しません。一方、2012年度の新課程から高校生は行列を勉強しなくなったそうですが、本書では現在大学1年生が学ぶような、行列を含む線形代数の基礎についても扱います。行列の扱いに慣れておくことは、統計学や機械学習の専門書を読む上でとても役に立つからです。

 専門家という生き物はしばしば、ついあれもこれもと自分の知っていることについて語りたくなる習性を持っていますが、本書においては心を鬼にしてそうした誘惑を抑えたいと思います。本書の目的は、忙しい大人であっても最短距離で、統計学や機械学習を理解するための数学的素養を身につけることです。そのためには、情報量を増やすことよりも、いかに優先順位の低いところから情報量を削減して効率化するか、という点の方が重要となるはずです。もし本書の内容を一通り理解した後、もっとしっかり数学を勉強したい人がいたらそれはとても素晴らしいことですが、そうした役割は本書の最後に紹介する「次に読むべき本」に任せましょう。

 また、本文中での例示については、可能な限り全て統計学に関係する、ビジネスマン向けの具体的なものとしました。「たかしくんがリンゴを2個買いました」といった子どもっぽい話も、「毎秒2cmで動く点P」といった実態が不明で無味乾燥な抽象概念も、本書の中には登場しません。

 なお、本書の読者に要求する前提知識ですが、小学校で習う分数や小数の四則演算、すなわち足し算、引き算、掛け算、割り算と、ちょっとした図形の知識さえ知っている方であれば問題なく理解できるよう、そこから丁寧に説明していきたいと思います。