「医」の最前線 AIと医療が出合うとき

外科医のパフォーマンス向上へのAI活用
~手術手技を客観的に評価する技術~ (岡本将輝・ハーバード大学医学部講師)【第16回】

 外科医療の根幹を成す手術手技は、外科医の日々の鍛錬によってその質が高められ、最良の手術成果が追い求められている。医療におけるあらゆる診療科の中でも最も職人的と言える外科医療であるが、定量的な観測が容易ではないことから、「外科医のパフォーマンス評価」はどうしても主観的になりやすいという課題があった。また同時に、外科医間・施設間での手技水準に一定のばらつきが存在することも否定できない。近年、このような手術手技を客観的に評価し、外科医への適切なフィードバックによってパフォーマンス向上を図ろうとする動きが見られており、その技術の中心にはAIの存在がある。

生体肺移植手術の様子(2021年4月、京都大医学部付属病院提供)

 ◇ 動画分析によるパフォーマンス評価

 外科医のパフォーマンスを評価する客観的指標を考えるとき、手術時間や出血量、合併症発生率、患者予後など、比較的数値化しやすい項目に目が向きがちとなる。一方、これらの項目は「手術の結果」を示す値であって、術中の何をどう修正することで確かな改善が得られるかを明らかにするには、解釈に一定の想像や推定を含まざるを得ず、必ずしも具体的な改善点を直接示すものではない。本来的には、その根幹にある「手術手技そのものの精度」を有効に客観評価して指標化し、要修正点を明らかにする必要がある。

 手術手技に関するスキルとその質は、術中に収集される動画をデコードすることで可視化できる。現在は、熟練した外科医による手作業での後方視的分析も部分的には行われている。しかし、この人間主導のアプローチは、レビューする外科医の解釈に依存する主観的なものであり、外科医がすべての術中活動を正確に把握していることを前提とするため、信頼性を担保しにくい。また、熟練した専門医の存在と膨大な時間・労力を必要とするため、拡張性がないことも課題となっている。

 近年の深層学習技術およびコンピュータービジョン関連技術の発展に伴い、動画の自動解析による「手術手技そのものの客観的な精度評価」が可能になろうとしている。これは外科医のパフォーマンス評価とフィードバックを通し、外科医療の品質向上と質の均てん化に資する可能性が高く、私見としては遠からず一般化する技術とみている。

米カリフォルニア工科大学(同大学ホームページより)

 ◇ 米大学が提案する「手術手技の評価・フィードバックシステム」

 米カリフォルニア工科大学(Caltech)の研究チームは、手術手技の評価と改善点のフィードバックを行う革新的なAIシステムを提案しており、2023年3月30日に3誌から公開された一連の論文によって解説しているので(※1〜3)、ここでも紹介しておきたい。「Surgical AI System(SAIS)」と呼ばれるこのシステムは、近年画像認識におけるブレークスルーとして捉えられる「Vision Transformer(ViT)」を活用している。

 画像認識におけるディープラーニングとしては、CNNをベースとした「畳み込みを用いたアーキテクチャー」がこれまで高いパフォーマンスを示してきた。一方、ViTは畳み込みをせず、これを上回るほどの高性能と圧倒的に少ない計算コストで、画像認識における新たな局面を切り開いたモデルとなる。チームが構築したシステムは、手術の手順、外科医が行った動作(手術針の保持や組織への刺入、抜去など)、これらの動作の質を正確に識別する。複数の異なる医療機関データを用いた広範な検証を通じても、本システムが注釈のない動画データから手術動作とスキルに関する情報を提供できることを示している。また、SAISは外科医のスキル評価を行うと同時に、評価に最も関連した映像を強調表示することで、具体的なフィードバックを行うことができる。

 チームでは、AIによるフィードバックと人間の専門家によるフィードバックとを比較しており、両者が多くの点でオーバーラップすることも実証している。さらに、人間のフィードバックと一致するようにAIシステムを明示的にトレーニングすることで、新しい手術動画に対するAIベースのフィードバックの信頼性が向上することも明らかにした。この事実は、特定のスキルに焦点を当てた信頼性の高いフィードバックを提供することで、外科医のトレーニングを支援するAIシステムを構成できる可能性を示すものだ。

 このように、AIシステムによる術中活動の正確かつ定量的なデコードは、最適な手術動作の特定に直結するとともに、外科医へのフィードバックに利用できる。さらにこの技術は、術中要因と術後成績との関連を調査する研究を促進することにもつながるため、外科医療の要素を明確化して、最善の結果を得るために必要となる形に体系化する作業も可能とする。外科手術の体得は「See one, do one, teach one」(見て覚え、やって覚え、人に教えて理解を深める、の意)といった20世紀のハルステッドモデルを採用し続けている。これに対して、AIを活用した手術手技の評価・トレーニングプログラムは、スキル習得を高次元で標準化することにより、患者の長期術後成績を向上・均一化する可能性があり、今後の発展への期待が大きい領域と言える。(了)


【引用】
(※1)Kiyasseh D, Ma R, Haque TF, et al. A vision transformer for decoding surgeon activity from surgical videos. Nat Biomed Eng (2023). https://doi.org/10.1038/s41551-023-01010-8.
(※2)Kiyasseh D, Laca J, Haque TF, et al. Human visual explanations mitigate bias in AI-based assessment of surgeon skills. npj Digit Med. 2023; 6: 54. https://doi.org/10.1038/s41746-023-00766-2.
(※3)Kiyasseh D, Laca J, Haque TF, et al. A multi-institutional study using artificial intelligence to provide reliable and fair feedback to surgeons. Commun Med. 2023; 3: 42. https://doi.org/10.1038/s43856-023-00263-3.


岡本将輝氏

【岡本 将輝(おかもと まさき)】
 米ハーバード大学医学部放射線医学専任講師、マサチューセッツ総合病院3D Imaging Research研究員、The Medical AI Times編集長など。2011年信州大学医学部卒、東京大学大学院医学系研究科専門職学位課程および博士課程修了、英University College London(UCL)科学修士課程修了。UCL visiting researcher、日本学術振興会特別研究員(DC2・PD)、東京大学特任研究員を経て現職。他にTOKYO analytica CEO、SBI大学院大学客員教授(データサイエンス・統計学)など。メディカルデータサイエンスに基づく先端医科学技術の研究開発、社会実装に取り組む。

【関連記事】

「医」の最前線 AIと医療が出合うとき