生成ＡＩで研修医の診断精度アップ…ただし正答が示されないと逆に低下「うのみにせず疑うことが必要」

2026年6月30日 15時45分

　生成ＡＩ（人工知能）を皮膚科の初期診療に使うと、研修医の診断精度が向上したとする研究成果を近畿大のチームが発表した。

　ただ、ＡＩが正答を示さなかった場合、精度は低下した。チームは「ＡＩの回答をうのみにせず、時には疑うことが必要だ」としている。

　医療の分野では、大量の画像データをＡＩに学習させ、診断などに活用する取り組みが進んでいる。だが、初診時に得られる患者の性別や年齢といった個人情報や症状などをもとに、生成ＡＩを診断に活用することの有用性は分かっていなかった。

　チームは、若手研修医２３人に計３０症例を示し、病気の診断をしてもらった。その後、対話型ＡＩサービス「チャットＧＰＴ―５」が症例ごとに示した三つの病名を参考にしながら再度、診断してもらった。

　その結果、最初に４３％（中央値）だった正答率は、ＡＩを使うと５０％にまで上昇した。ただ、ＡＩが示した病名に正答がなかった１３症例に限ると、正答率は１５％から８％に下がった。

　チームの大塚篤司教授（皮膚科学）は「本来、医師は難しい症例では何度も検査を重ねて診断を確定するが、知識や経験の浅い医師は生成ＡＩが回答を示すことで安易に飛びついてしまうことが懸念される」と話している。論文が、国際学術誌に掲載された。

　愛媛大の藤沢康弘教授（皮膚科学）の話「今回の研究は十分な知識のない人がＡＩを使うと危ないということを示した。ＡＩに頼りきりになれば医師の能力がどんどん落ちるという研究もあり、上手な付き合い方を考えていく必要がある」

ざっくり言うと