Image: David Nield - Gizmodo US

今どき自力で文字起こしをやってる人なんていない? いやまだまだいるって?

ここ1〜2年で、AIのおかげで文字起こしの性能が飛躍的に便利になりました。

会議の議事録、授業内容、インタビューのメモ等の録音データは、今や数時間…どころか数秒でテキストに変換してくれるのが当たり前。数年前は当然のように文字起こしは人力でやっていたというのに…。

また、「ライブキャプション」といったアクセシビリティ機能も充実してきて、元の動画に字幕がなくても、リアルタイムに字幕まで付くようになりました。

音声の文字起こし処理には時間・リソースを食うので、無料でできる範囲は限られていますが、今すぐ無料で利用できる文字起こしサービス5つをご紹介。日本語に対応していないものもありますが、ニーズに合わせて使いこなしていきましょう〜!

Googleレコーダー

Image: Google

GoogleレコーダーはAndroidの純正アプリで、完全無料で利用可能!

ただし制約があって、それは録音済みの音声ではなく、ライブ音声のみを処理できること。そしてGoogle Pixel端末である必要があります(ウェブインターフェースもありますが、ファイルを再生するだけで作成することはできません)。

Pixelユーザーかつライブ音声の処理で十分であれば、Google レコーダーで完全に事足ります。必要に応じて外部マイクをハンドセットに接続することもできますし、音声の録音と同時に文字起こしされたテキストがリアルタイムに画面に表示されます。

文字起こしテキストの検索も簡単で、「笑い声」や「音楽」といったようなキーワードで音を検索することもでき、テキストを少し修正するだけでオーディオを編集できて、AIによる要約も得られます。日本語にも対応していて精度はかなり高いですよ。

Samsung(サムスン)のスマホの場合、Voice RecorderとGalaxy AIは同様に機能しますし、AppleもiOS 18に同様の機能を追加しました。

Whisper

©Whisper uses OpenAI to transcribe audio.

OpenAIのWhisperは、誰でも無料で音声からテキストへの変換エンジンを利用できます。

ただし、Hugging Faceのウェブインターフェースを使用する(便利ですが、混雑して遅くなりがち)か、デスクトップ版をローカルにインストールする(高速ですが、PCは一定のスペックが必要)のどちらかが必要です。

ウェブインターフェースは非常に使いやすくて、音声ファイルをアップロードするか、直接PCのマイクから録音するだけで利用できます。数分の処理の後、テキストがウィンドウの反対側に表示されます。さらにAIで音声を翻訳することもできますよ。

処理時間を待てない人は、高スペックのPCが必要ですが、Whisperをインストールして使うのもオススメ。インストールまでは簡単ではありませんが、一度できてしまえば、ローカルでAI通訳サービスを無料で何度でも利用できます。日本語にもばっちり対応しています。

Otter

Image: Otter

Otterは、昔からあるプロフェッショナル向けの文字起こしサービスです。磨き込まれたUXに豊富な機能が備わり、音声を自動で文字起こしするだけでなく、要約や話者の識別、音声データの検索、さまざまなサードパーティー製アプリとも統合されています。しかし、それなりに使う場合は、それなりに課金が必要です。

毎月300分まで無料で使えますが、各会話につき30分、そして3回の音声またはファイルのアップロードに制限されていて、これ以上利用したい場合は、有料プランへのアップグレードが必要。プロプランは月8.33ドル(約1,300円)、ビジネスプランは月20ドル(約3,200円)。ただし現時点では日本語には未対応です。

Happy Scribe

Image: Happy Scribe

Happy ScribeもOtterと同じく、大企業から個人まで幅広い利用層に対応した文字起こしサービスです。無料プランでは、音声ファイルは10分まで、ファイルのエクスポートは不可等の制限があります。有料プランは月17ドル(約2,700円)です。

Happy Scribeのエレガントでスリムなユーザーインターフェースは特筆すべきところ。皆さんも使い慣れてるであろうGoogle Docsに似てるので操作もしやすく、文字起こしされたファイルには、話者のラベルとタイムスタンプも付いていて、レビューのツールもシンプルで使い勝手良し。

文字起こしされたファイルは、必要に応じてタグ付けされて、フォルダに整理できます。またビルドインの翻訳ツールに、AIが予想できないような単語を追加できるカスタム辞書などの便利な機能も散りばめられています。さらに希望に応じて、人力による文字起こしも有料で利用可能です。日本語にも対応していますよ。

MeetGeek

Image:MeetGeek

MeetGeekは、インタビューや会議の議事録、顧客との会話、オンライン授業まで、ほとんどすべてに対応した文字起こしサービスです。基本機能が会議の議事録用途に設計されていますが(なのでMeetGeekというサービス名)、任意の音声にも対応しています。

Webインターフェースにアクセスすると、カレンダーや過去の録音など、MeetGeekのさまざまな機能にアクセスできるようになっています。複数人での利用にも適していて、数回クリックするだけで全員に文字起こしファイルのデータをメールで送信することができます。無料プランの場合は月に5時間まで。文字起こしのデータは3カ月間、音声は1カ月間保存され、AI会議要約などの機能も含まれます。有料プランは19ドル(約3,000円)からで、日本語にも対応しています。

PLAUD NOTE AI ボイスレコーダー GPT-4o連携
27,500円
Amazonで見る
PR

Google Pixelスマホのレコーダーアプリを使いこなすコツ