AIの発達によって、本人そっくりの自然な音声を生成できる技術が進化しています。例えば、2024年3月に発表されたOpenAIの音声合成は、15秒の短い音声サンプルだけで、自然な音声を生成できると話題になりました。電話詐欺などの犯罪に悪用されるリスクが指摘される一方、このような技術は人々を助ける可能性も秘めています。

↑AIが生成した声でも気持ちは伝わる

昨年、脳にできた腫瘍を取り除く手術を受けた、米国に住む21歳のアレクシス・ボーガンさん。手術から約1か月が経ち、つながれていた呼吸チューブを外したとき、唾をのみ込むことや親に「Hi」の一言を言うだけでもつらかったと言います。その後、何か月にもわたるリハビリを経ても、発声がうまくできず、家族や友だちも彼女が何を伝えようとしているのか理解しづらい状態が続きました。

そんな彼女に光を与えたのが、OpenAIの音声合成。この技術のパイロット試験の一環として、彼女はOpenAIの音声合成を利用することになったのです。昔録画していた動画から、15秒間の彼女の音声を読み込ませ、本人さながらの声を生成。いまではアレクシスさんは1日40回ほどスマホのアプリを使って、周囲の人とコミュニケーションを取っているそうです。

合唱団に所属していて、クルマの中で大好きな歌手の曲にあわせて大きな声で歌うのが好きだったというアレクシスさん。一夜にして自分の声が消え、「自分のアイデンティティの一部が奪われてしまったようだった」と、そのときの心のうちを語っています。

でも「(合成された)娘の声を聞くたびに、本当に感動している」と、涙を浮かべながら話している母のパメラさん。ときどき、発音ミスやイントネーションがおかしいといった不具合は見られるものの、それはほとんど気づかない程度なのだとか。

OpenAIの音声合成はまだ一般公開されていませんが、彼女と同じように、声を失った人や言語障害に苦しむ人にとって希望の光になる可能性を秘めているようです。

