Nature Communicationsに掲載されたこの研究では、MedSAMという革新的なツールが紹介されています。これは、CT、MRI、胸部X線、超音波、内視鏡など10種類の画像モダリティにわたり、30種類以上のがんを含む約160万枚の医療画像を用いて開発されました。
MedSAMは、高度なトランスフォーマーアーキテクチャを基盤とし、画像の特徴を抽出するためのビジョントランスフォーマー(ViT)ベースの画像エンコーダ、ユーザーインタラクションを統合するプロンプトエンコーダ、そしてセグメンテーション結果と信頼スコアを生成するマスクデコーダを備えています。
このツールは、医療画像のセグメンテーションにおいて正確さと効率性を実現し、診断ツールの進化と治療計画の個別化を促進する大きな可能性を秘めています。MedSAMの開発と検証には、広範なデータセットが用いられ、その一般化能力と実用性が示されました。