生成AIで研修医の診断精度アップ…ただし正答が示されないと逆に低下「うのみにせず疑うことが必要」
生成AI(人工知能)を皮膚科の初期診療に使うと、研修医の診断精度が向上したとする研究成果を近畿大のチームが発表した。
ただ、AIが正答を示さなかった場合、精度は低下した。チームは「AIの回答をうのみにせず、時には疑うことが必要だ」としている。
医療の分野では、大量の画像データをAIに学習させ、診断などに活用する取り組みが進んでいる。だが、初診時に得られる患者の性別や年齢といった個人情報や症状などをもとに、生成AIを診断に活用することの有用性は分かっていなかった。
チームは、若手研修医23人に計30症例を示し、病気の診断をしてもらった。その後、対話型AIサービス「チャットGPT―5」が症例ごとに示した三つの病名を参考にしながら再度、診断してもらった。
その結果、最初に43%(中央値)だった正答率は、AIを使うと50%にまで上昇した。ただ、AIが示した病名に正答がなかった13症例に限ると、正答率は15%から8%に下がった。
チームの大塚篤司教授(皮膚科学)は「本来、医師は難しい症例では何度も検査を重ねて診断を確定するが、知識や経験の浅い医師は生成AIが回答を示すことで安易に飛びついてしまうことが懸念される」と話している。論文が、国際学術誌に掲載された。
愛媛大の藤沢康弘教授(皮膚科学)の話「今回の研究は十分な知識のない人がAIを使うと危ないということを示した。AIに頼りきりになれば医師の能力がどんどん落ちるという研究もあり、上手な付き合い方を考えていく必要がある」

