Googleの科学者チームが、咳や呼吸などの音を評価することで健康状態を検出し監視するのに役立つ機械学習ツールを開発しました。この人工知能(AI)システムは、人の音の数百万のオーディオクリップで訓練され、将来的にはCOVID-19や結核の診断、個人の肺機能の評価に医師が使用する可能性があります。
このシステム、Health Acoustic Representations(HeAR)と呼ばれるものは、大規模なデータセットで訓練され、複数のタスクを実行するために微調整できるという点で新しいアプローチです。現時点では、HeARが商業製品になるかどうかはまだ分かりませんが、興味を持つ研究者が自分たちの調査でモデルを使用できるようにする計画があります。
このAIツールは、音声録音(例えば、咳の音)とその音を出した人の健康情報を組み合わせたもので訓練されます。Googleの研究者たちは、自己教師あり学習を使用し、公開されているYouTube動画から咳、呼吸、喉をクリアする音など、人間のさまざまな音声の300万以上の短い音声クリップを抽出しました。
HeARはCOVID-19や結核の検出、人が喫煙者かどうかなどの特徴を検出するために適応されました。そのトレーニングデータの範囲が広いため、研究者はこれらの疾患と特徴にラベル付けされた非常に限られたデータセットを使用してそれを微調整するだけで済みました。
この研究は、健康音響学、または「オーディオミクス」と呼ばれる分野でのプロミスを示しています。AIと機械学習を使用することで、同時に多くのデータを収集し分析する手段が提供され、病気の診断、スクリーニング、モニタリングにおいて大きな可能性があります。