10分から15分ほどの短いストーリーの読み上げ音声を配信するオーディオプラットフォーム「Pocket FM」に対して、コンテストのために集めた音声サンプルをAIトレーニングに使用したのではないかという指摘が行われています。

ElevenLabs partners with Pocket FM to create more audio for less time and money - Rest of World

https://restofworld.org/2024/elevenlabs-pocket-fm/



「Pocket FM」は2018年創業のオーディオプラットフォーム。ファンタジーやSF、ホラー、ロマンスなど多岐にわたるお話を10分から15分程度の短い読み上げ音声として配信していて、インドを本拠として20カ国以上に展開。ダウンロード数は2023年時点で1億件を超えています。2024年には小説投稿プラットフォーム「Pocket Novel」も立ち上げて、15万人を超える作家により、25万点以上の小説がアップロードされています。

読み上げ音声は、以前はナレーターと編集者が作成していましたが、読み上げAIを扱うElevenLabsと提携して、AIによる自動音声が利用されるようになっています。

ElevenLabsと提携を行ったのと同時期に、Pocket FMはインドで「声優発掘コンテスト」を開催し、参加者に英語、ヒンディー語、タミル語、テルグ語で10分のサンプル音声提出を求めました。



声優のスルヤン・シン氏は、コンテストの条項に「参加者は、提出された音声サンプルについて、Pocket FMに対して使用、複製、変更、翻案、翻訳、配布、公開、派生作品作成および世界中のあらゆるメディアでの表示に関する独占的、ロイヤリティフリー、永続的、譲渡可能、取消不能および完全なサブライセンス可能な権利を付与します」という内容があることから、Pocket FMがコンテストをAI音声のトレーニング用データの収集に利用したのではないかと、疑いの目を向けています。

その上で、「初心者にとっては絶好の機会に思えますが、10分の音声サンプルを求められるという事実に注意してください。あなたの声のクローンを作成し、知らないうちに何時間ものコンテンツに作り替えられる可能性があります。また、隠された条件がある可能性もあります。あくまで私の意見ですが、慎重に行動してください。メールで依頼を受けたのではない場合、契約条件をよく読んでください。あなたの権利を守るためのお願いです。AIレプリカは、声優にとって真の脅威です」と、注意を喚起しました。



コンテストに20本以上の音声サンプルを提出したというマノハール・ラオ氏は、ニュースサイトのRest of Worldに対して「確かに、私の音声サンプルのさまざまな表現、アクセント、感情が彼らの手に渡っているのではないかと、どこか心配なところはあります」とコメントしています。

なお、Pocket FMは指摘のあった条項を削除した上で、「すべての音声サンプルは参考として用いるだけであり、複製または商業目的での利用はしない」と表明しています。

Pocket FMと提携したElevenLabsのサム・スカラー氏は、Pocket FMとはコンテストに関する音声サンプルやデータのやりとりを行っておらず、AIのトレーニングはElevenLabsの音声ライブラリのデータで行ったものだと説明しました。ElevenLabsのライブラリには、何千もコミュニティから収集した、テキストから音声にするのに適した29の言語の音声データがあるとのことです。