メインコンテンツへスキップ

活用領域拡充

(東北×京都×大阪)

活用領域拡充チームとは

 活用領域拡充チームは、従来にない視点で臨中ネットという事業の活用領域を広げることを目指し、2025年度から新たに設置されました。2025年度の担当施設は、京都大学、東北大学、大阪大学(取りまとめ)です。

 臨中ネットは、臨床研究に関する資源を比較的多く有する臨床研究中核病院間の協力により、医療関連データの広範かつ効率的な活用を推進するという、野心的でユニークな取り組みといえます。医療情報を中心とする多くの専門家の長年にわたる取り組みを経て、全施設が出力・提供する「臨中ネット共通データセット」の仕様がすでに策定されています。一方、全参加施設によるデータ統合と解析の事例はまだなく、「絵に描いた餅」の懸念を払拭することが課題となっています。現在、臨中ネットデータを用いた記述的な研究が進んでいますが、これらは一部施設のデータのみを利用しています。

 臨中ネットで構築してきたさまざまなシステム基盤やノウハウを活かしていくためには、医療・健康関連データをめぐる国内外の環境の中で本事業の特質を正しく理解し、目標と戦略を的確に定める必要があります。特に、本事業の発展の鍵を握る、データ利活用とユーザーからのフィードバックのサイクルを立ち上げていくためには、臨床研究者を中心とするさまざまなステークホルダを臨中ネットの「潜在ユーザー」と捉え、こうした人々に臨中ネットを正しく知ってもらい、協業していく必要があります。

具体的な取り組み

活用領域拡充チームでは、以下の領域に取り組みます。
  • 1. 活用戦略検討

     データベースに関する技術的課題ではなく、臨中ネットの事業的側面に注目します。臨中ネット「取りまとめ施設」(名古屋大学、慶應義塾大学、九州大学)の関係者と協力し、全ての臨中ネット参加施設と共に、臨中ネットにおけるこれまでの議論を踏まえ、本事業の価値と超えるべきハードルについて論点を整理し、活発な意見交換ができる場を作ります。その上で、臨中ネットの真価を引き出す方策について、合意をまとめつつ、施設等により意見や立場の異なる部分についても明らかにします。こうした検討に基づき、「潜在ユーザー」を主な想定読者として、臨中ネットの価値を分かりやすく伝える総説を、臨中ネットの全参加施設の総意として出版することを目指します。

     臨中ネットの目標を広く捉えるなら、厚生労働省の医療DX構想にもある医療データ二次利用に先鞭をつけることであり、その社会的重要性は論を待ちません。一方、参加施設にとって経済的利益といった分かりやすいインセンティブは十分ではなく、根本的に利他的な側面があります。ここでは、さまざまな立場や考え方を認め合う丁寧な議論により、社会的な価値創造への道筋を探ります。

  • 2. 試験的活用事例創出

     臨中ネットのデータ利用として従来、「単独での」「データ駆動型研究への」利用が想定されてきました。(「データ駆動型研究」は探索的な疫学研究を指します。)本チームではこれに加え、以下の二つの戦略を重視します。

  • 2-1a. 診療レジストリ、画像や生理検査等の外部データとの結合

    臨中ネットの本質は、「共通データセット」として多施設間で標準化された臨床データの提供といえます。「共通データセット」は単独で「データ駆動型研究」に役立つ可能性があります(上図左)。一部施設ではSEAMAT等の規格に基づく構造化データがすでに構築されていることから、これを「共通データセット」と組み合わせることで、活用の幅が広がる可能性があります(上図中央)。さらに、多施設で構築されている領域別の診療レジストリ等の既存構造化データとの組み合わせも有望です(上図右)。このように、臨中ネットの枠にとらわれず、多様なデータを柔軟に組み合わせることが、幅広い価値につながる可能性があります。

    †SEAMATJCSデータ出力標準フォーマットガイドライン): 一般社団法人日本循環器学会が策定した、医療データ規格の一つ。

  • 2-1b. EDC入力を要する研究の効率化

     今日、「ビッグデータ」と総称されるような各種の医療関連データに基づく後ろ向き観察研究が多く行われている一方、ランダム化比較試験をはじめとする前向き研究や、研究課題特有の情報収集を伴う緻密な後ろ向き研究は不足しており、この原因の一つがデータ収集にかかる多大な費用や現場負担です。臨中ネットのような多施設間のデータ標準化により、ランダム化比較試験を含めた信頼性の高い研究にかかる費用や現場負担を大幅に軽減しえますが、こうしたアプローチの成功例は世界的にも多くありません。

     本チームではこのような戦略に沿う具体的なプロジェクトを試行し、ノウハウ蓄積、人材育成、将来的な方向性の検討、ステークホルダの信頼獲得など、臨中ネットを中心とするエコシステムの構築につなげていきます。

  • 2-2. 治験実施可能性調査

     近年急速に発達した「生成AI」と「AIエージェント(※)」の技術を組み合わせることで、自然言語での指示だけでデータベースから必要な情報を抽出することが可能になってきました。本取り組みでは、この最新技術を治験候補者抽出に適用し、臨床現場での実用化を目指しています
    ※ AIエージェントとは、生成AIを活用しながら、人間の指示を理解し、自律的に考えながら作業を進めるAIシステムです。複雑な作業を複数のステップに分解し、エラーが起きても自ら修正しながら目標を達成します。優秀なアシスタントのように、試行錯誤しながら問題を解決することができます。

システムの仕組み

 本システムでは以下のような流れでデータ抽出を行います。
  • 1.医師が自然言語で指示

    「50歳以上で○○の病名の患者さんを探して」といった普段の言葉で依頼
  • 2.生成AIとAIエージェントが連携

    指示を理解し、必要な作業を自動的に計画
  • 3.複数のデータソースから情報収集

    1. 臨中ネットデータベース(患者基本情報、処方、注射、検査など)
    2. 電子カルテを含むデータベース(構造化データ、非構造化データ)
    3. 文書など(医学論文、ガイドライン、各種ファイルなど)
  • 4.SQLを自動生成・実行

    専門知識がなくても、AIが適切なデータベース言語(SQL)を作成して実行
このように、専門的なプログラミング知識やデータベースの知識がなくても、自然言語での対話だけでデータ抽出が可能になります。

治験候補者抽出の現状と課題

 治験には、参加できる患者さんの条件(適用基準)と参加できない条件(除外基準)が細かく定められています。例えば「50歳以上65歳以下」「特定の検査値が基準範囲内」「重篤な肝機能障害がない」「特定の薬を服用していない」などです。現状、条件に合う患者さんを見つけるため、主治医の記憶に基づく候補者選定や、CRCやデータマネージャーによる電子カルテの手作業での確認作業、カルテ記載の目視確認が行われています。これらの作業は、数日から数週間もの時間がかかり、治験候補患者の抽出は非常に非効率であるとともに、見落としや偏りが生じる可能性もあります。

本取り組みが目指すもの

 臨中ネットのデータベースや電子カルテのデータベースなどを活用しながら、データベースの専門知識がなくても、医師の記憶に頼ることなく、客観的かつ効率的に候補者を抽出できるシステムの開発・検証を目指しています。

 単施設での検証を経て、複数施設、最終的には臨中ネットの全施設への展開を目指します。

期待される効果

  • 作業時間を大幅に短縮数週間かかっていた作業を数時間程度に

  • 医師の記憶に頼らない客観的な抽出データベースを網羅的に検索

  • データベースを網羅的に検索適用基準・除外基準を自動で整理し、優先度をつけた候補者リストを作成

  • カルテ記載も活用医師の記録や看護記録から副作用歴や症状を自動抽出

  • 迅速な実施判断新しい治験を受け入れられるか、すぐに評価可能

 なお、AIには限界やエラーもあるため、最終的な判断は医療従事者が行うなど、人の判断と適切に組み合わせながら、安全で確実なシステムの実現を目指しています。

  • 3. 潜在ユーザーとのネットワーク形成

     臨床研究の資源としての臨中ネットについて認知を広め、「潜在ユーザー」との対話の機会も増やす目的で、臨床系学会等の集会等で紹介をしていきます。

まとめ

 10年後、臨中ネットは事業として発展しているのでしょうか。または、臨中ネットはすでに存在しなくなり、これとは別の、何らかの価値ある遺産がもたらされているのでしょうか。または、歴史をつぶさに学ぶ者だけが知る教訓だけが残るのでしょうか。

 本チームだけでできることは限られていますが、本邦を代表する医療データの専門家が集う臨中ネットの底力を引き出すためのきっかけ作りを目指します。