非劣性試験で明らかになった自律型AIの診断能力:大腸内視鏡検査の新たな可能性

この研究は、大腸ポリープの光学診断における自律型人工知能(AI)とAI支援型人間(AI-H)の診断精度を比較した無作為化非劣性試験です。患者は、1つの学術機関で選択的大腸内視鏡検査を受ける患者を対象とし、自律型AIまたはAI-Hによる診断を受けるよう無作為に割り当てられました。主要な結果は、病理学をゴールドスタンダードとして用いた光学診断の精度であり、副次的な結果は、監視間隔に対する病理学との一致率でした。

結果として、467人の患者が無作為に割り当てられました(自律型AIグループ238人/158個のポリープ、AI-Hグループ229人/179個のポリープ)。自律型AIグループの光学診断の精度は77.2%(95%信頼区間[CI]、69.7-84.7)であり、AI-Hグループの精度は72.1%(95% CI、65.5-78.6)でした(P = .86)。高信頼度の診断において、自律型AIグループの精度は77.2%(95% CI、69.7-84.7)、AI-Hグループの精度は75.5%(95% CI、67.9-82.0)でした。また、自律型AIは監視間隔に対する病理学との一致率がAI-Hよりも有意に高かった(91.5% [95% CI, 86.9-96.1] vs 82.1% [95% CI, 76.5-87.7]; P = .016)。

この結果から、自律型AIによる光学診断は、内視鏡医による診断と比較して非劣性であり、監視間隔の一致率においても優れていることが示されました。

引用元)https://pubmed.ncbi.nlm.nih.gov/38331204/

関連記事