医療・医薬・福祉

医療データ利活用のYuimedi、愛媛大学と共同でLLMとRAGを活用した新たな医薬品用語マッピング手法を開発

株式会社Yuimedi
株式会社Yuimedi(本社:東京都中央区、代表取締役:グライムス英美里、以下「Yuimedi」)は、愛媛大学(愛媛県松山市、大学長:仁科弘重)と共に大規模言語モデルと検索拡張生成を統合した新たな医薬品用語マッピング手法を研究・開発しました。さらに、その手法で生成したデータを薬剤師でキュレーションしてオープンデータとして公開しました。それぞれの成果を査読付き論文誌の「Healthcare Informatics Research」と「Data in Brief」に報告したことをお知らせします。


日本の研究者が国際的なリアルワールドデータ(以下「RWD」)研究へ参画することが困難な理由のひとつとして、日本の医薬品用語集が国際的な標準用語集と連携していないことが指摘されています。この課題に対し、Yuimediは愛媛大学と共同で大規模言語モデル(以下「LLM」)と検索拡張生成(以下「RAG」)を組み合わせて日本の医薬品用語を国際的な標準医薬品用語 RxNorm にマッピングする手法を研究・開発しました。この手法を用いてマッピングした成果を2名の薬剤師によってレビューの上、オープンデータとして公開しました。
RWDを用いた医学研究の促進のためには、国際的な標準用語のマッピング拡充は必要不可欠です。Yuimediは、本研究で対象とした医薬品用語のみならず、その他の医療用語マッピングの効率化に向けて引き続き研究を行っていきます。また、その成果の公開やLLMとRAGを用いたマッピング手法の実用化を通し、RWDを用いた医学研究の発展に貢献していきます。

■本研究の背景
国際的な医学研究における大きな課題のひとつは、薬剤用語の取り扱いです。この課題は、国をまたいだ薬剤名、投与量、剤形、包装、投与方法の不一致から生じます。単純な文字列比較や単語ベクトルを用いた類似性の評価では高いマッピング精度を達成できないことが多くあります。そのため、人によるレビューが必要となりますが、このアナログな作業は膨大な工数を要します。そこで、この作業を生成AI自動化させることがマッピングプロセスの効率向上に寄与するかについて検証しました。

■本研究の内容
今回開発した手法の目標は、マッピング候補を提案する際に文字列比較のみに依存する従来のシステムよりも高い精度を達成することでした。



fig. LLMとRAGを組み合わせた薬物概念マッピング システムのワークフロー( Eizen Kimura, Yukinobu Kawakami, Shingo Inoue, Ai Okajima. (2024). Mapping Drug Terms via Integration of a Retrieval-Augmented Generation Algorithm with a Large Language Model. Healthcare Inform Research, 30(4): 355-363. https://doi.org/10.4258/hir.2024.30.4.355

まず、薬価基準に収載された医薬品について成分名と規格を組み合わせた名称を機械翻訳し、英語表記の医薬品名(Normalized name)を準備しました(fig内1.)。次に、OHDSIの標準的な用語集から取得した医薬品の名称を元に、BioBERT*を用いて医薬品名称の埋め込みベクトルを作成し(fig内2.)、RAG**にてマッピング候補薬の名称を選び出す仕組みを構築しました(fig内3.~5.)。さらに、適切な候補薬を提案したか評価するプロンプトを組込み、LLM毎の推論機能の違いがマッピング精度に影響を与えるか調査しました。本研究で開発した手法では、従来の手法では捉えにくかった表記揺れや濃度表記の違い等を包含し、より精度の高いマッピング候補薬を導くことに成功しました。
先行研究の手法により提案されたマッピング候補薬に対して、内服薬および注射薬のカテゴリーを対象とし、2名の薬剤師により目視で成否を確認しました。候補薬が不正確、あるいは欠落している場合は、RxNAV***とATHENA****を用いて手動で適切なマッピングを行いました。作成したマッピングデータは、オープンデータとして公開しています。
* BioBERT(Bidirectional Encoder Representations from Transformers for Biomedical Text Mining):医療・生物学領域のテキストを解析するために開発された自然言語処理モデル
** RAG(Retrieval-Augmented Generation):LLMに外部データベースの情報を取り入れることで、より正確で有用な応答を生成する仕組み
*** RxNAV:米国国立医学図書館が提供する医薬品情報検索ツール
**** ATHENA(Automated Terminology Harmonization, Extraction, and Normalization for Analytics):OHDSIが管理する、標準語彙提供ツール

■本研究の展望
本研究では、日本の医薬品用語を国際的な標準用語にマッピングするための効率的な手法を開発しました。この手法は、従来の方法に比べ、高精度でマッピング候補を提示できるため、マッピングプロセス全体の効率向上に大きく寄与します。また、得られたマッピングデータセットは公開されており、日本の医薬品データを国際的に共有し、グローバルなRWD研究の促進に貢献することが期待されます。

■本研究の成果に対する愛媛大学 研究代表者からのコメント
愛媛大学大学院 医学系研究科 医療情報学講座 教授 木村映善先生
RWD(Real World Data)に関する研究には様々な課題がありますが、その中の一つとして、十分な数のコーホートを確保することが困難である場合が挙げられます。希少疾患やがん治療の比較などにおいては、国内の医療機関だけでは十分な情報が集めきれず、海外のコーホートとの統合による分析が期待されつつあります。
本研究は、日本の研究機関が、国際的な横断研究のフレームワークを提供するOHDSIプロジェクトに参画する際の障壁の一つである「国内の医療に関する概念をOHDSIの標準統制用語集にマッピングする」というタスクの解決に貢献することを目指しています。
私たちの取り組みが、日本のRWD研究を国際的な潮流へ合流させるための橋渡しとなることを願っています。

■参照
1報目:https://synapse.koreamed.org/articles/1516088909
Eizen Kimura, Yukinobu Kawakami, Shingo Inoue, Ai Okajima. (2024). Mapping Drug Terms via Integration of a Retrieval-Augmented Generation Algorithm with a Large Language Model. Healthcare Inform Research, 30(4): 355-363. https://doi.org/10.4258/hir.2024.30.4.355
2報目:https://www.sciencedirect.com/science/article/pii/S2352340925001507?via%3Dihub
Eizen Kimura, Yukinobu Kawakami, Shingo Inoue, Ai Okajima. (2025). A dataset for mapping the Japanese drugs to RxNorm standard concepts. Data in Brief, 59: 111418. https://doi.org/10.1016/j.dib.2025.111418

【RxNormについて】
米国国立医学図書館(NLM)によって管理されている、米国で入手可能なすべての医薬品を収録した国際的な標準医薬品用語集のことです。

【Healthcare Inform Researchについて】
1987 年に設立された韓国医療情報科学会 (KOSMI) の公式ジャーナルです。医療情報学の基礎的理解を促進し、医療分野における知識と応用システムを前進させることを目的としています。医療分野の情報システムの設計、開発、実装、評価の分野を扱っています。また、医療情報学の保健政策、教育、管理、行動の側面、標準化、セキュリティ、生物医学工学、バイオインフォマティクスなどの医療情報インフラストラクチャも扱っています。

【Data in Briefについて】
The Lancet、Cell、Tetrahedron Letters 等の先端的な科学学術雑誌や専門書を出版している欧州屈指の歴史ある学術専門出版社のひとつであるエルゼビア社が発行する、多分野にわたるオープンアクセスの査読付きジャーナルです。研究データの説明とアクセスを提供する短くて読みやすいデータ論文を主に公開しています。

【愛媛大学大学院 医学系研究科 医療情報学講座 教授 木村映善先生について】
1999年北海道大学医学部卒業、2003年愛媛大学大学院医学系研究科修了。愛媛大学医学部医療情報部助手、保健医療科学院の統括研究官を経て、2020年5月より現職。愛媛大学医学部附属病院の医療情報部部長として医療情報システムを統括管理する傍ら、医療情報の利活用を推進するべく、ネットワーク、医療情報の総合運用性を高める標準規格やセキュリティ等応用的な研究に従事。

【会社概要】
会社名:株式会社Yuimedi
事業内容:医療データ標準化BPaaS、医療データ利活用ネットワークの構築
代表取締役:グライムス英美里
創業:2020年11月
会社HP:https://yuimedi.com/
OMOP変換サービスLP :https://yuimedi.com/omop
企業プレスリリース詳細へ
PR TIMESトップへ
本コーナーの内容に関するお問い合わせ、または掲載についてのお問い合わせは株式会社 PR TIMES ()までご連絡ください。製品、サービスなどに関するお問い合わせは、それぞれの発表企業・団体にご連絡ください。

関連記事(PRTIMES)