小児希少疾患の診断に期待
~成育センター、顔写真データ作成に道筋~
国立成育医療研究センター(東京)が診断のために顔写真のデータを収集・作成する試みを行い、「サイエンティフィック・リポート」誌に論文を発表した。大量のビッグデータでなくても、一定数のデータを得ることで治療用AI(人工知能)を構築できる可能性を示したことが画期的だ。今後、対象患者数が限られる小児の先天性疾患(希少疾患)の診断への応用が期待されている。
論文として発表された顔の画像データ
◇特徴的な顔貌
小児の希少疾患の多くは、特定の遺伝子の発現や機能の異常による生まれつきの病気だ。よく知られているのは、ダウン症や色素性乾皮症などだ。ダウン症は筋肉量が少なく、発達に遅れが見られる。色素性乾皮症はDNAの修復がうまくいかず、紫外線を浴びると皮膚がんを発症する。
希少疾患の小児は特徴的な顔立ちをしているケースが多い。生まれたばかりの赤ちゃんを多数診察してきたベテランの小児科医は、顔貌から遺伝子の異常がある可能性を察知するという。赤ちゃんの顔写真データがあり、疾患が早期に分かれば、その後の治療の助けとなる。この試みのリーダーであるシステム発生・再生医学研究部の岡村浩司・組織工学研究室長は「顔は健康な赤ちゃんかどうかを区別する重要な要素だ」と強調する。
岡村浩司・組織工学研究室長
◇AIの発達
AIの進歩は著しい。「教師あり機械学習」といい、データに分析結果などの「正解」を添えてコンピューターが実行するプログラムに学習させる手法がある。また、「ディープラーンニング」は、十分なデータ量があれば人間の力なしにAIが自動的にデータの特徴を抽出する。具体的には、人間の脳の神経細胞の仕組みを模倣した「ニューラルネットワーク」を利用してデータに含まれる特徴を自動的に学習する。
最近、将棋や囲碁など知的ゲームのAIが急速に発達したのも、ディープラーンニングによるところが大きい。
岡村室長はこう説明する。「例えば、肝臓移植の際には免疫抑制剤を用いるが、拒絶反応を伴う。一方で、拒絶反応を起こさない患者もいる。やってみなければ分からなかったが、ディープラーニングによって予測できるようになる」と言う。ただ、ディープラーニングには大量のデータをそろえる必要がある。岡村室長は「小児の希少疾患は、10万人に数人というように比率は大変小さく、ビッグデータを集めるためには大きな壁がある」と話す。
◇高い精度のモデル
データのセットはオンラインで同意を得て作成した。同センターの人たちから始め、その家族や友人たちへと拡大していった。収集した顔写真のデータは277人、計2429枚で白人や東南アジア系の人も含まれている。「目標としていた男性100人、女性100人を超えた」と岡村室長。大量のデータとは言えないが、そもそも小児の希少性疾患の患者は少ない。「少ないデータでも一定の成果を得ることができた」と、その意義を語る。
「教師あり機械学習」に必要な性別や笑顔などの情報は提供者からは収集せず、研究メンバーの主観による多数決で準備した。
顔写真の人物は男性なのか、女性なのか。簡単に見分けがつくだろうと考えてしまいがちだ。ただ、女性的な容貌の人もいれば、逆のケースもある。笑顔にしても、本人が笑っているつもりでも他人からはそう見えないこともあるだろう。後日、女装した男性が紛れていたことが分かったが、「男性」と答えたのは1人だけだったため「女性」とされ、モデル作成のための学習が行われた。
結果として、性別は98・2%、笑顔かどうかについては93・0%の認識精度のモデルを作ることができた。
◇個人情報完全保護での利用を
医療面でもAIへの期待は大きい。しかし、ハードウエアの性能やソフトウエア開発に目が行きがちで、データの収集や整理、「教師あり機械学習」のための正解となる注釈を付ける過程(アノテーション)で壁にぶつかることが多い。
岡村室長は「顔写真の収集・解析は医療に限らず意義があるが、個人情報保護の重要性が増している。今回はある程度の成功を収めたが、写真提供を拒まれるケースもあり、この手法のままで規模を拡大することは困難だ」と言い、今後、研究チームで個人情報が完全に守られた形での顔画像利用を検討する考えだ。(了)
(2022/08/18 05:00)
【関連記事】