世界の高血圧人口は増加傾向にある。最適な高血圧治療を提供するに当たり、ガイドラインは重要なツールである。徳島大学医学部3年生の鹿島修一郎氏らは、米・OpenAI社が開発した大規模言語モデル(LLM)を用いた対話型人工知能(AI)である「ChatGPT」が有するポテンシャルを、日本高血圧学会が作成した『高血圧治療ガイドライン2019(JSH2019)』に掲載されているクリニカル・クエスチョン(CQ:高血圧治療に関する臨床課題)およびクエスチョン(Q:実地医家が臨床上疑問に思っている項目)に対する回答により評価。結果を、Circ J2023年6月7日オンライン版)に報告した。

正答率は、CQで80%、Qで36%

 高血圧は脳心血管疾患(CVD)の主要な危険因子であるため、CVDの予防に当たり効果的な血圧管理が求められる。その実践において、CQとQという2種のQ&A形式を取り、専門家以外でも理解が容易な高血圧治療ガイドラインは重要な支援ツールとなる。しかし、ガイドラインの中にはCQが含まれていないものも多く、医療者が最新の情報を適時に入手しづらい場合もある。

 ChatGPTは、機械学習を利用して大量のテキストデータから言語パターンを学習し、それに基づいて自然な対話を生成することができる。鹿島氏らは今回、AIが医療分野でガイドラインの解釈を補助できるかを検討する目的で、ChatGPTのJSH 2019に掲載されているCQおよびQへの回答能力を評価した。

 31項目の質問について評価した結果、20項目で正確な回答が得られ、正答率は64.5%だった。Qへの回答の正確性は36.0%にとどまったのに対し、CQの正答率は80.0%と有意に良好な結果だった(P=0.005)。

 以上から、同氏らは「ChatGPTのようなAIは、エビデンスが確立されている質問に対しては高精度に回答できるが、エビデンスが不明瞭で専門家の間でも意見が分かれるような質問事項に関しては、正確な解答を出すのが難しいことが示された。ChatGPTは、ガイドラインの解釈を補助するツールとしては有用だが、現時点でその能力には限界があり、全ての疑問を解決することはできない。医療現場においては、専門的な知識と判断力を有する医療者による監督の下、適切に活用することが重要だ」と結論。さらに、「AIの適用範囲、医療現場での効果的な利用方法などを模索するには、さらなる研究が必要だ」と付言している。

(比企野綾子)