成功したらAIに ごほうびを上げる 「強化学習」とは?

写真拡大

東京オリンピックの喧騒が去った2020年、あなたはどんな生活をしているだろうか?
AIによってシンギュラリティは起きるか? ヒト以上にやさしいAIは登場するか? ヒトとAIはどう共存していくのか?
IT書籍の売上累計が150万部を超える中、2007年に処女小説『エブリ リトル シング』が17万部のベストセラーとなり、中華圏・韓国での翻訳や2回の舞台化(2008年井上和香、2009年内山理名主演)された作家・ITライターの大村あつし氏。
構想・執筆に2年かけた『マルチナ、永遠のAI。――AIと仮想通貨時代をどう生きるか』が出版され話題となっている。
ビットコイン、ブロックチェーン、ディープラーニング……正確な技術論と、その道の世界的権威の見解をもとに緻密に描いた作品で、SFではない、というから注目だ。
実物通貨と仮想通貨、日常と非日常、ヒトとAIの境界線がどんどんなくなりつつある今、私たちはどうやって生きていけばいいのか?
AIは苦手というあなたも、これさえ覚えておけば、周囲から尊敬の眼差しを浴びるかもしれない。
2000年代中盤から「AI」と「IoT」を研究し続けてきた大村氏の「強化学習」特別寄稿をお送りする。
(構成・寺田庸二)

ごほうびほしさに努力⁉
あまりに人間くさい
AIの学習方法

 前回の第6回連載では、将棋AIの「ポナンザ」が、自分自身を二分割する「AIの自己分割」という手法で自己対戦を700万局もこなして、2017年の第二期電王戦で佐藤天彦(あまひこ)名人に勝利したエピソードを紹介しました。

 このケースもそうですし、囲碁で2016年にGoogleの「アルファ碁」(AlphaGo)がイ・セドル九段を破ったケースでも、実はある学習方法を活用していました。

 それが「強化学習」と呼ばれるものですが、まずは強化学習よりもわかりやすい例として「教師あり学習」について簡単に紹介します。

続きはこちら(ダイヤモンド・オンラインへの会員登録が必要な場合があります)