FDAが承認したAI医療機器のほぼ半数が実際の患者データに基づいてトレーニングされていないことが研究で明らかに
人工知能(AI)の技術進化は日進月歩で、すでに医療の現場にも応用されつつあります。しかし、患者のプライバシーに関する懸念やデバイスの精度などの理由で、AIを応用した医療機器やツールに対して懐疑的な見方をする人もいます。ノースカロライナ大学医学部、デューク大学、オックスフォード大学、コロンビア大学、マイアミ大学など複数の研究機関のチームが、AIとアルゴリズム技術が医療現場での使用にどの程度承認されているかを評価する論文を発表しました。
https://www.nature.com/articles/s41591-024-03203-3
Almost half of FDA-approved AI medical devices are not trained on real patient data, research reveals
https://medicalxpress.com/news/2024-08-fda-ai-medical-devices-real.html
研究チームによると、アメリカ食品医薬品局(FDA)によるAI医療機器の承認数は急増しているそうで、2016年には年間平均2件だった承認数が、記事作成時点では年間69件にまで増加しているとのこと。これは、AI医療技術の商業化が急速に進んでいることを示しています。
研究チームは、FDAの公式データベース「Artificial Intelligence and Machine Learning (AI/ML)-Enabled Medical Devices」に掲載されているすべてのAI医療機器の申請を分析しました。
その結果、FDAが承認したAI医療機器521件のうち、臨床的検証データの内訳は回顧的バリデーションのものが144件、予測的バリデーションのものが148件、ランダム化比較試験によるものが22件、そして臨床的検証データがないものが226件だったことがわかりました。
回帰的バリデーションは、新型コロナウイルス感染症が流行する以前の胸部X線写真など、過去の画像データをAIモデルに入力して検証を行います。予測的バリデーションは逆に、患者からのリアルタイムデータに基づいて検証を行うため、科学的にはより強力なデータが得られます。ランダム化比較試験は、例えばCTスキャンデータを人間の放射線科医(対照群)とAI(実験群)にランダムに振り分けることで、デバイスのパフォーマンスを評価する方法です。
しかし、研究チームは、FDA承認を受けたAI医療機器の約43%で臨床的検証データが公表されていない点に注目しています。
さらに、一部のデバイスは実際の患者データではなく、コンピューターで生成した架空の画像を使用しており、臨床的検証の要件を満たしていなかったケースもあったそうです。研究チームは、FDAの2023年9月に発表されたガイダンスにおいて、異なる種類の臨床的検証研究の区別が製造業者への推奨事項に明確に示されていないことも指摘しました。
この結果を受けて、研究チームはFDAと機器製造業者に対し、臨床的検証研究の種類を明確に区別し、その結果を公開することを強く推奨しています。また、回帰的バリデーション、予測的バリデーション、ランダム化比較試験それぞれの定義を標準化し、業界全体で使用することを提案しました。