画像認識、言語翻訳、人工知能などの分野で活用されている「ディープラーニング」について簡単に解説するムービー「Introduction to Deep Learning: What Is Deep Learning?」をMATLABがYouTubeで公開しています。ムービーではディープラーニングのはじまりや具体的な実用例が挙げられており、まったくの初心者でもなんとなくディープラーニング技術についてイメージできるような内容になっています。

Introduction to Deep Learning: What Is Deep Learning? - YouTube

「近年、大きな注目を集めているディープラーニングとは何でしょうか?」と話す、MathWorksのシャマル・パテル氏。ディープラーニングが注目されるのには、それなりの理由があるとのこと。



パテル氏は、「ディープラーニングとは何か?」「実際にどのように利用されているのか」「どうやってディープラーニングについて学び始めればいいか」の3点をムービーで解説してくれるそうです。



ディープラーニングとは機械学習の一つで、特徴やタスクをデータから直接学習できるという特徴があります。データは主に画像、テキスト、音から構成されます。



ディープラーニングではよく「End to End(エンドツーエンド)」の学習が可能だと言われます。その意味を、画像認識を例に挙げて説明してみます。



ある画像を自動車、トラック、ボートなどのカテゴリに分類する場合を考えます。まずは、ラベル付き画像のイメージやトレーニング済みのデータを用意するところから始めます。



ラベルはタスクで求められる出力に一致するもので、物の特徴を教えるのに必要となります。ディープラーニングのアルゴリズムは、画像のイメージから特徴を読み取って、どのカテゴリに分類すれば良いかを学びます。このように、画像などのデータから直接学習できる特長からディープラーニングを「エンドツーエンドの学習」と呼んでいるわけです。



ディープラーニングの他の例はロボットです。



ロボットはアームを使って物の動きを直接学ぶことで、物をどのように取り扱えば良いのかを学ぶことができます。画像の分類やロボットアームのどちらの例も、ディープラーニングを使って画像認識を行っています。



ディープラーニングは、元々は郵便局での仕分け作業に活用されていました。1990年代に手紙に手書きされた郵便番号を読み取って、仕分ける作業に利用されたのがディープラーニングの始まりです。



しかし、ディープラーニング技術が一気に重要性を増したのはここ5年のこと。それには3つの要素が挙げられます。



1つ目は、ディープラーニングメソッドが画像分類において、人間よりもエラー率で下回るレベルに到達したこと。



2つめは、グラフィックボードの性能向上で演算能力が飛躍的に向上しディープネットワークの処理を現実的な時間で行えるようになったこと。3つめは、ディープラーニングに必要な大量のラベル付きデータにアクセスできるようになったことです。



ほとんどのディープラーニングメソッドでは「ディープニューラルネットワーク」構造を用います。これが、ディープラーニングとディープニューラルネットワークを同義語のように取り扱うゆえんです。



最も一般的なディープニューラルネットワークは「Convolutional Neural Network(畳み込みニューラルネットワーク)」として知られるネットワークで「CNN」と呼ばれます。CNNは特に画像データの取り扱いに適していることで知られます。



「ディープ」という用語は、たいていの場合、ニューラルネットワークにおける「hidden network(隠れ層)」の数が多いことを意味します。古典的なニューラルネットワークでは2〜3つの隠れ層があるだけでしたが、近年のディープラーラーニングでは150層もの隠れ層を使うとのこと。



「ここまででディープラーニングのキーとなるコンセプトは理解したはず。ということで、ディープラーニング技術が実際にどのように使われているのかを説明します」



これは、MATLABで使っている画像認識技術。机の上の電話機をカメラで映すと、それが何であるのかを確率付きで表示します。



ノートPCを映すと、「laptop」「notebook」と認識。ディープラーニングによって、被写体の特徴を読み取りデータに照らし合わせることで「それが何なのか?」をコンピューターが判断しています。



これは走行する自動車の車載カメラの映像から、前方の物体が「一時停止」を示す標識であることを認識している例です。



ムービー冒頭で話した「ディープラーニングとは何か?」「実際にどのように利用されているのか」について説明しましたが、3つめの「どうやってディープラーニングについて学び始めればいいか」については、「mathworks.com/deep-learning」を参照して欲しいと、ムービーは締めくくられていました。