「視覚による盗聴」の時代にようこそ

MTE5NDg0MDYyMjY1NjczMjMx_0

2008年のSFサスペンス映画「イーグル・アイ」の冒頭シーンで、主人公はあらゆる場所に存在するコンピューターのマイクロホンからなんとか自分達の会話を隠すことを試みる。だが残念ながら、邪悪なコンピューターは彼の近くに置いてあったコップに入った水の映像にズーム・インし、その水面の振動から彼らの会話を「盗聴」してしまう―。

こんなこともそう遠くないうちに可能になるかもしれない。最近MITとマイクロソフト、アドビの研究者たちは、視覚情報から音を再構築することができるコンピューター・アルゴリズムを開発した。1つの例として、彼らは15フィート遠方の防音ガラスごしに撮影された「ポテトチップスの袋」から識別可能な音を復元することができたという。

「まさにハリウッド・サスペンスの世界です」カリフォルニア大学バークレー校の電気工学およびコンピューター・サイエンスの準教授、アレクセイ・エフロスはMITニュースに語っている。「ポテトチップスの袋の振動する監視映像によって、殺人犯は自分の罪を認めることになるでしょう」

研究者たちのレポート「視覚によるマイクロフォン:ビデオからの受動的な音の復元(The visual microphone: passive recovery of sound from video)」では、コップ1杯の水や鉢植えのプラント、ティッシュの箱、ポテトチップスの袋を含む日常のオブジェクトを録画し、それら各々から音を捕らえる実験の成功の様子が概説されている。研究者たちは実際のスピーチ(この場合「メリーは小さな羊を飼っていた(Mary had a little lamb)」という言葉)を復元できただけでなく、その性別やスピーカーの人数なども識別できたという。

この技術が科学捜査や監視に応用できることは間違いない。しかしエフロスは、最も価値のある利用法はまだ未発見のものだろうと語っている。

「私は、まだ誰も想像できないような利用法があるだろうと確信しています」彼は説明する。「素晴らしい科学というものは、最初誰かが何気なく始めたものを、別の誰かが想像もしなかった形で使ったときに証明されるものです」

トップ画像提供:carterse

Lauren Orsini
[原文]