画像提供:マイナビニュース

写真拡大

●およそ1兆円をR&Dに投資

日本マイクロソフトは9月15日、AIに関するプレスラウンドテーブルを開催。同社のこれまでのAI研究の取り組みを紹介するとともに、最近のトピックを改めて紹介した。

マイクロソフトのAI研究は、1991年に開設された社内研究機関「Microsoft Research」を中心に行われてきたが、同社は昨年9月に、他の組織に分散していたAIの研究組織を統合し、「Microsoft AI and Research グループ」を設立した。このグループは社内の研究所、そして、Bing、Cortana、Azure Machine Learning などの製品グループから、約7,500名のコンピュータ サイエンティスト、研究者、エンジニアを集結した。

日本マイクロソフト 執行役員 最高技術責任者 榊原彰氏は、「マイクロソフトは、売上の12〜14%、およそ1兆円をR&Dに投資しており、AI研究はMicrosoft Research設立当初から研究の中心であった。その成果は、スパムフィルター、地図の経路最適化、モーションセンサーなどに搭載して製品化してきた。それがいま、さらに加速している。その背景には、クラウドが進展し、使えるリソースが無尽蔵に増えたことと、深層学習が進化し、ニューラルネットワークを取り入れ、システムの学習機能が飛躍的に伸びている点がある」と、同社がAIに多く投資を行っている点を強調した。

同氏は研究技術が製品になるまでのプロセスには、研究、開発、事業化、市場投入の4つがあるとし、研究/開発には高度な専門性、差別化できる技術などのテクノロジーのイノベーション、事業化/市場投入には、コストを下げる、少ない工程でのスピーディな製品の投入というプロセスイノベーションが必要だとした。

しかし同氏によれば、最近は世の中の早い動きに合わせて製品化を加速する必要性が出てきており、開発の部分に事業化/市場投入のプロセスを取り込み、まずは市場投入は最小限で始め、そのフィードバックを製品に反映して改善していく「リ-ンスターットアップ(Lean Startup )」を取り入れている企業が多いという。そのためには、開発からリリースまでの期間を短縮する必要があり、DevOpsを取り入れ、アジャイルな開発を推進する必要だとした。

そして、同氏はマイクロソフトのAIの製品化の方針について、次のように説明した。

「マイクロソフトはAIの民主化をコンセプトにかかげている。その意味するところは、リーズナブルなコストで誰でも使い易く、すべての業種に提供していくのがマイクロソフトのスタンスだ。CEOのサティアナデラも、AIは人間の仕事を置き換えるものではなく、人間の能力を補助する、支援するためのものだといっている。マイクロソフトはクラウドファースト、モバイルファーストを推進しているが、最近はこれにAIを加え、インテリジェントクラウド、インテリジェントエッジにコンセプトを変更している。今後はこの方針にしたがって、製品、サービスを提供していく」(榊原氏)

そして同氏は、AIを組み込んだ同社の製品を紹介した。

●新たに「りんなライブ」を開始

同氏は、AIがまず利用されるのは、ビッグデータに向けた統計の部分だとして、「Azure Machine Learning Studio」を紹介。これは、データを活用した予測分析ソリューションの構築、テスト、デプロイをソフトをインストールすることなく、Webブラウザで接続するだけで利用できる開発環境。

70種類以上の標準的な統計関数数学を装備し、その関数をドロップし、入力ソースを定義するだけで設定でき、アウトソースを次の関数に引き渡すこともできるという。特徴は、ノンプログラミングで作成できる点で、完成品をWebサービスとして提供でき、他のシステムからAPI経由で呼び出すこともできるという。さらに、テンプレートも用意され、それをベースにカスタマイズして構築することも可能だという。

「データサイエンティストの中にはプログラムができない人もおり、そいいう人にとっては、使い易いツールになる。また、自身がすでに作成したアルゴリズムをRやPythonで書き直すことで、拡張関数として組み込み、再利用できる。使い易く、拡張性のある環境だ」(榊原氏)

同氏が次に紹介したのは会話するAIで、女子高校生の人格をもったチャットボット「りんな」だ。「りんな」は一昨年提供を開始し、LINEとTwitterで利用できる。すでに570万人がフォローしているという。この技術は、ローソンが「ローソンクルー あきこちゃん」という公式キャラクターにも利用している。

また、マイクロソフトは、男性キャラの「りんお」も、今年の3月、期間限定で公開している。

さらに同氏は、「りんな」の新たな展開として、「りんなライブ」を開始したことを発表。これまで、「りんな」は1:1でトークしていたが、「りんなライブ」は1:多で会話でき、合成音声でしゃべるのが特徴。感情に応じて返答が変わるというパラメータを持っており、今後は歌を歌うなどの機能を追加していくという。「りんなライブ」は、100以上同時接続が可能で、Azure Web App service+ASP.NETのテクノロジーを利用しているという。

「AIは生産性向上に注力しているが、感情によりそうことも必要だ」(榊原氏)

感情を持つAIという点では、SBIリクイディティ・マーケットおよびSBI FX トレードがマイクロソフトと連携し、深層学習を搭載したチャットボットサービスを導入、顧客からのFX取引や為替に関する定型的な質問(FAQ)などに対しての自動回答サービスを提供している。問い合わせ履歴などをAIに学習させることで、将来は個別の口座や取引状況を把握し、顧客の心理までを理解して対応できる品質まで精度を高めていくという。

音声認識では、デジタル エージェント「Coltana」をOEM提供している製品を紹介。音声認識の組み込んだスピーカーとして、Harman Internationalのスマートスピーカー「Harman Kardon Invoke」を紹介。また、HPも「Cortana」搭載のスピーカーを出すという。

さらに、先月にはマイクロソフトはAmazonとの提携も発表。今年後半に提供される機能により、Windows 10 PC上のCortana経由でAlexaにアクセスできるようになるという。

これについて榊原氏は、「CortanaはBtoBの領域でスケジュール確認や会議室予約などに使われているが、BtoCに強いAmazonさんとの提携で相互の補完関係になり、いい提携になった」と述べた。

また、同氏は同社のAIの特徴を、「音声認識や画像認識、顔認識、言語理解、翻訳などのAIはAPIとして提供しており、現在29種類ある。APIはAmazon、IBM、Googleもやっているが、われわれの強みはカスタマイズができる点だ」と語った。

そして、音声認識では、米国のマクドナルドのドライブスルーの注文に利用されている例を紹介。これは顧客からの声での注文をまずテキストに変換し、それを注文伝票に反映させていくもので、それが会計に回され、レジ打ちの必要もないという。北米の店舗でPoCを行い、今後、展開を図っていく予定だという。

顔認識では今年の4月、博報堂、博報堂アイ・スタジオ、日本マイクロソフトの3者が、顔の特徴や感情に合わせて商品やサービスの広告を出し分けるアウトドア・メディア及びターゲティング広告配信システムである「Face Targeting AD (フェイスターゲティング・アド)」を連携して開発したことを発表している。

また、エイベックスはAIで会場内に設置したカメラで来場者の顔を検知し、ライブの盛り上がりや演奏されている楽曲と、「怒り」、「軽蔑」、「嫌悪感」、「恐怖」、「喜び」、「中立」、「悲しみ」、「驚き」の感情との関連性を分析、数値化する実証実験を行うことを発表している。

そのほか、翻訳機能をPowerPointに利用する例を紹介。日本語で書かれたPowerPointのスライドを一瞬でアラビア語やタイ語に変換する例を紹介。現在、テキストの翻訳は60カ国に対応しているという。

また、最後にSNSでスペイン語と英語で音声入力したものを日本語でアップしていく様子を紹介。音声認識の翻訳は現在10カ国に対応しているという。