<?php the_title_rss(); ?>

写真拡大 (全10枚)

議事録の作成はとても大変な作業だが、AIとスマートスピーカーを活用して自動化するシステムに注目が集まっている。東京ビッグサイト 青海展示棟で、4/3〜5まで開催中の「第3回 AI・人工知能EXPO」において、TISインテックグループは「COET Record Meeting」(コエット・レコード・ミーティング)を展示している。3月28日に発表されたばかりで、4月に提供が開始される予定のスマートスピーカーを使ったクラウドサービスだ。

白熱する「きのこvsたけのこ あなたはどっち派?」論争の議論をリアルタイムでテキストに変換してタブレットに表示する「COET Record Meeting」

●声の方向から話者を特定

「COET Record Meeting」は会議全体を録音するとともに、発言ごとに誰のものかを認識しつつテキスト変換を行ってくれる。話者を識別するのは声のする方向検知を使う。使用するスマートスピーカーには16個ものマイクロフォン(マイクアレイ)を装備していて、声のする方向(発話方向)を1度単位で検知できると言う。この機能を活用して話者を特定する。

会議の真ん中に置いて、議事録の自動生成を行う「COET Record Meeting」で使うスマートスピーカー

認識した音声はSNSのように発言単位でまとめてテキストに変換される。そのためピンポイントで発言内容を確認できるほか、テキスト変換の対象となった音声も対になって保存されているので、テキスト変換が正しくないなと感じたらすぐにその音声を再生して確認したり、変換した文字を修正することができる。

発話ごとにテキスト変換され、その元になった音声の再生ボタンも同じ欄に表示されていて便利

●会議ごとにQRコードを発行(セキュアに共有)

「COET Record Meeting」の構成は、スマートスピーカー、小型のディスプレイ、スマートフォンのアプリ。小型のディスプレイには会議ごとに発行するQRコードが表示されるので、スマートフォン用のアプリでそのQRコードを読み込むと、音声がリアルタイムにテキスト変換される会議のスレッドに入ることができる。そのため、会議の内容は参加者のみセキュアな環境で閲覧できるしくみとなっている。

システムの構成はスマートスピーカー(中央)、会話内容がリアルタイムでテキスト変換されるスレッドを表示するためのスマートフォン(タブレット)用アプリ(右)、そのスレッドにアクセスするためのQRコードを表示する小型のディスプレイ(左)

●会議のリアルタイム翻訳も可能

リアルタイム翻訳機能も備えている。リアルタイムにテキスト変換されるアプリ画面を見ながら会議に参加できるので、外国語を話す発話者の会話が聞き取れなかったり、聞き逃した場合も、直前の発話をアプリでチェックすることができ、会議の流れに置いて行かれる、といった事態を防ぐこともできる。

リアルタイムのテキスト変換のほか、翻訳した文章を表示することもできる(画面は日本語の会議で英語の翻訳文を表示しているところ)

●「きのこvsたけのこ あなたはどっち派?」体験

会場ブースでは「きのこvsたけのこ あなたはどっち派?」という熱い議論を「COET Record Meeting」がリアルタイムで議事録をとる体験に参加できる。参加することで、「COET Record Meeting」による記事録の自動作成の作業手順や主な機能が体験できる。その様子を動画で撮影したので参考にして欲しい。

熱い議論の議事録を「COET Record Meeting」が自動生成

「きのこvsたけのこ あなたはどっち派?」

■「きのこvsたけのこ あなたはどっち派?」熱い議論の議事録を自動作成:

●インバウンドの観光受付などにも活用できる

なお、「COET」事態は、AI活用の潮流であるVUI(Voice User Interface)による新たなソリューションで、記事録の自動作成のような音声認識機能のほか、観光案内所などでは外国語を話す来所者との会話を自動翻訳、音声合成で読み上げる機能なども持っている。その意味では対話エンジンを組み合わせた音声・対話AIサービスとなっている。

今後は、FAQや翻訳機能を提供するインバウンド対応サービス、音声認識・音声合成などの技術とAIスピーカーなどのデバイスやロボットを組み合わせて自動対話を実現するクラウドサービスなどのメニューを提供していく予定だ。

(神崎 洋治)