Hmcomm、動画・音声コンテンツをアップロードするだけで自動で音声をテキスト化する「VBox」を提供開始

写真拡大 (全2枚)

「VBox」は、動画コンテンツに字幕をつけるだけでなく、インタビュー音声の自動書き起こしや、音声をテキスト化することによる動画編集作業の効率化などにも活用できるとのことです。

なお、「VBox」に採用されている音声認識クラウド・プラットフォーム「The VOICE JP」は、自然な発話での音声認識を実現する音響学習技術とディープラーニングを用いた言語学習機能をもっており、使えば使うほど利用者の業務特性に最適化される仕様になっています。

■対応する主なファイル

音声: MP3, WAV, iTunes Audio (.m4a、.m4b、.m4p), Ogg, ACCなど
動画: MPEG-4 (.mp4、.m4v), Ogv, WebMなど

■音声認識クラウド・プラットフォーム「The VOICE JP」の特長

(1)自然な発話での音声認識を実現する音響学習技術で、あらゆる声質・アクセント・スピードに対応
(2)「金利」、「赤残」などの業界・社内特有の用語・略語・フレーズ、「Instagram」、「フィンテック」などの新語・時事用語・流行語・芸能人名などにも対応。誤認識された場合の訂正・単語登録、メール・Word・CRMなどの社内データやインターネット上のテキストデータから最新用語・話題の学習を行う