治療の効果判定などの臨床アウトカムは、電子カルテのデータを使用して評価できると考えられている。しかし電子カルテの多くは経過記録などの入力形式が定められていない非構造化データであり、日本では評価の手法が確立されていない。宮崎大学、株式会社NTTデータ、ファイザーの共同研究グループは昨日(11月24日)、がん患者の電子カルテデータから薬物治療の効果判定に関連するキーワード、遺伝子検査の結果などを抽出することに成功したと発表した。評価手法の確立に向けた研究の前段階として今回実施された。

非構造化データに単語の重要度評価やなどを適用し構造化

 研究グループは、わが国の医療分野における科学技術の向上とリアルワールドデータ(RWD)の利活用を進めるため、コンピュータの自然言語処理による臨床アウトカム評価について共同研究を行っている。

 RWDの代表ともいえる診療報酬請求データでは、薬剤の治療効果や安全性などの臨床アウトカムは得られにくい。それに対し、同じRWDである電子カルテのデータを用いた場合、臨床アウトカムを評価できる可能性がある。ただし、臨床アウトカムに関連するデータの多くは入力形式が定まっていない非構造化データであるため、電子カルテのデータで臨床アウトカムを評価するには、まずデータを構造化する必要がある。

 今回、研究グループは、電子カルテに保存されている非構造化データに単語の重要度評価や態度表現分析などの自然言語処理技術を適用。がん患者の薬物療法による効果などの臨床アウトカムを客観的に評価する手法を検討した。また、診療報酬請求データベースでは得られにくい遺伝子検査結果などについて、電子カルテデータから収集可能かを検討した。

臨床上重要なキーワードを抽出

 対象は、2018年4月~20年9月に宮崎大学病院に通院または入院したがん患者115例の電子カルテデータ。主要評価項目は薬物治療の効果判定に重要と考えられるキーワードの抽出、副次評価項目は薬物治療ラインや遺伝子検査結果の抽出とし、評価の際に単語の重要度評価や態度表現分析などの自然言語処理技術を適用した。

 解析の結果、薬物治療の効果判定に関連する臨床上重要なキーワードとして、「縮小」「効果」「著変」「改善」などが電子カルテデータから特定された。また、遺伝子検査296件のうち77%の検査結果を抽出できた。

 研究グループは、がん患者の電子カルテの非構造化データから薬物治療の効果判定に関連するキーワードや遺伝子検査結果を抽出することが可能であったとしている。

(田上玲子)