AI生成のレントゲン画像、専門家でも見分けられない。医療ハッキングの怖さ
AI技術の発展で、画像や動画を手軽に編集できるようになりました。編集どころか、ゼロから作るのも簡単。
ただし、AI生成画像・動画には楽しいことだけでなく、不適切なフェイク画像にフェイクニュース、著作権など、さまざまな問題がついて回っています。医療現場でもAI生成画像のリスクがあります。
ニューヨークのマウントサイナイ医科大学の研究チームが、医療現場のディープフェイク画像リスクを調査しました。
偽レントゲン画像、わかる?
研究チームは、6カ国から17人の放射線科医に協力を依頼。本物のレントゲン画像とAI生成の偽レントゲン画像が混ざった画像データセットから、 本物のレントゲン画像を見分けるテストを実施しました。
テストデータセットの1つは、半分が本物、半分がChatGPT-4o生成の合計154枚のレントゲン画像。もう1つは、胸部レントゲンに特化してトレーニングしたAIモデルが生成した画像を含む110枚(本物とAI生成が半分ずつ)のセット。
また、17人の医師も、AI生成画像が紛れこんでいることを知らされているグループと、テストの目的を何も知らされていないグループに分けられました。
その結果、テストの正解率は、AI生成画像があるとわかっていたグループで75%、何も知らされていないグループではなんと41%。 レントゲン画像の専門家ですら、本物とAI生成画像を見分けるのは非常に難しいことがわかりました。
協力してくれた医師は勤務年数1年目から40年のベテランまでおり、本物とAI生成画像を見分けるのに経験値は影響しなかったようです。不思議なのは、同じ放射線科医でも、骨、筋肉、靭帯など筋骨格系を専門とする放射線科医は、正解率が圧倒的に高いという結果に。
AIさえ騙される
見分けるのが難しいのは人間だけではありません。偽レントゲン画像を作ったAI(ChatGPT-4o)ですらも、テストでは騙されてしまいました。
画像見分けテストを4つのAIモデル(OpenAIのChatGPT-4o・ChatGPT-5・GoogleのGemini 2.5 Pro・MetaのLlama 4 Maverick)でも行ったところ、正解率は57%から85%。胸部レントゲン画像では、正解率は52%から89%。
今回のデモでディープフェイクのレントゲン画像は、もっともトレーニングを積んできた専門家である放射線科医すら惑わすことがわかりました。AI画像が紛れているとわかっていても見分けるのは難しいのです。
研究論文の主執筆者であるMickael Tordjman医師は、そう語ります。
医療ハッキングのリスク
AI生成のレントゲン画像を見分けられないとどうなるのか。専門家である医者、患者はもちろん、そのほか多くの人を巻き込む大きなトラブルとなる可能性があります。
たとえば、陪審員制度のあるアメリカでは、偽画像に陪審員が騙され、過度に同情するなどして判決に影響を与える可能性も。法の専門家の間ではすでに危機感が高まっているといいます。
Tordjman医師はサイバーセキュリティのリスクを指摘。もし、医療データに不正アクセスされ、偽レントゲン画像を差し込まれたら…。見分けることは非常に困難がゆえに、医療判断が狂ってしまうかもしれません。
研究チームは、今回の調査が、判別ツールや学習用データセットの構築に役立てばいいと語っています。
論文はRadiologyに掲載されています。
見分けテストやってみる?
本物のレントゲン画像と偽物のレントゲン画像を見分けるテストは、オンラインで公開されているので誰でもチャレンジすることができます。
Tordjman医師いわく、AI生成を見分けるのは、骨がツルツルすぎる、背中がまっすぐすぎる、肺が左右対称すぎるなど、不自然な完璧さにあるとのこと。
とはいえ、専門家すら見分けるのが難しいなら、見分けるコツを知っていても素人ならほぼ不可能でしょうね。

GIZMODO テック秘伝の書
