頭痛

頭痛診断AIで非専門医の正診率は46%→83%に上がる?日本発研究で分かった“得意と苦手”

Neurolog管理人
スポンサーリンク

はじめに:AIは問診の武器になるか

頭痛患者さんの訴えが複雑で、片頭痛なのか緊張型頭痛なのか、あるいは薬剤の使用過多による頭痛(MOH)が混在しているのか判断に迷う。

多くの非専門医の先生方や研修医にとって、頭痛診療は悩ましい領域の一つです。

今回ご紹介するのは、日本の頭痛専門医から報告された、問診データを用いたAI診断モデルの実践的な研究です。

結論から言うと、このAIの支援を受けることで、非専門医の診断正診率は46.0%から83.2%へと劇的に改善しました。

しかし、AIは万能ではありません。何が得意で、何が苦手なのかを知っておくことが、臨床応用への鍵となります。

今回の論文のPICO

本研究のデザインは以下の通りです。

P (Patient): 初診の頭痛患者 50名

I (Intervention): AIモデルによる分類の推論結果と、SHAP(判断根拠)の可視化を参照して診断する

C (Comparison): 問診票の情報のみで、AI支援なしで診断する

O (Outcome): 診断の正診率および一致率

※Reference Standard(正しい診断)は、4名の頭痛専門医による合議

そのまま使える!AIに入力された17の問診項目

この研究の最大の特徴は、画像や血液検査を使わず、問診票(17項目)のみでモデルを構築している点です。

頭痛の問診17項目として整理された以下のリストは、ICHD-3(国際頭痛分類第3版)に基づく診断において重要な要素を多く含んでおり、日常診療の問診テンプレートとしてもそのまま活用できます。

No.項目具体的な質問・選択肢の例
1年齢
2性別男性 / 女性
3身長
4体重※BMI算出や薬剤選択の参考に
5発症年齢何歳から、またはいつから始まりましたか?
6頻度月/年に何回、毎日、今回が初めて
7持続時間常に、数日間、1日、半日、1-3時間、瞬間的
8部位片側(右/左)、両側、中央、目の周り、前頭部、後頭部、側頭部、頭頂部、後頸部
9性状ズキンズキン(拍動性)、締め付けられる、突き刺すような、チクチクする、掴まれるような、えぐられるような、焼けるような、割れるような、重い
10重症度寝込むほど、寝込まないが生活に支障あり、支障なし
11運動による増悪動くと悪化する、改善する、変わらない
12随伴症状悪心・嘔吐、光過敏、音過敏、臭い過敏、目の充血、流涙、鼻汁、めまい、倦怠感、肩こり、首の痛み、手足のしびれ
13前兆の有無なし、閃輝暗点、手足のしびれ
14好発時間帯起床時、午前、午後、夕方、睡眠中、休日、月経時
15誘因なし、寝不足、寝すぎ、疲れ、ストレス、緊張、空腹、運動、飲酒
16急性期薬の使用薬剤名、頻度(1日/月/年に何回)、効果(無効/有効/著効)
17家族歴家族に頭痛持ちはいますか?(はい/いいえ)

AIはこれらの情報からパターンを学習しました。

特にAIの診断に強く寄与した(SHAP値が高かった)項目は、頭痛日数(頻度)、年齢、発症年齢、悪心の有無、音過敏の順でした。

これらは人間が片頭痛と緊張型頭痛を鑑別する際にもKeyとなる情報です。

結果:非専門医の診断はどう変わったか?

ここが本論文のハイライトです。

非専門医5名が、AIの支援なし・ありで同じ患者50名を診断した結果、以下のような劇的な改善が見られました。

統計学的にも有意な差が認められています。

指標AI支援なしAI支援あり改善度(p値)
正診率46.0%83.2%有意に向上 (p < 0.001)
一致係数 (κ値)0.2120.678有意に向上 (p = 0.002)

※統計手法:正規分布変数は対応のあるt検定、非正規分布変数はWilcoxonの符号付順位検定等を使用(有意水準 片側p<0.05) 。

AIの推論結果とSHAPによる判断根拠の可視化が加わることで、非専門医であっても専門医に近い診断精度を出せる可能性が示されました。

専門医の視点:AIの「得意と苦手」を知る

この素晴らしい結果を臨床に適用する際、注意すべきポイントが2つあります。

① AIが苦手=二次性頭痛(Red Flags)

本研究のLimitationとして、著者らも二次性頭痛の診断精度が低い(Class 5の感度・特異度が不安定)ことを挙げています。

実際、本研究のPhase 2においてAIと専門医の診断が食い違った症例には、髄膜炎、Chiari奇形、三叉神経痛などが含まれていました。

AIはあくまで問診票のパターン認識を行うツールです。くも膜下出血や脳腫瘍などの除外(Red Flagsの確認)は、問診だけでなく神経学的診察や画像検査(MRI/CT)と組み合わせて、必ず医師の手で行う必要があります。

② 外的妥当性と過剰診断の可能性

本研究は単施設(専門病院)のデータでしたが、後の2024年の報告(Okada et al. Life (Basel) 2024)による多施設共同検証では、全体の正診率は94.92%と高かったものの、片頭痛の特異度は66.67%と、本研究(80.00%)に比べて低下しました。

これは、プライマリ・ケアの現場などでは、AIが片頭痛と過剰診断しやすい可能性を示唆しています。

AIの結果はあくまで確率の高い候補として捉える姿勢が重要です。

Take Home Message

  • 問診票をアップデートしよう: 紹介した17項目は、AIだけでなく非専門医にとっても強力な武器です。特に頻度、悪心、音過敏は必ず確認しましょう。
  • AIは「強力なセカンドオピニオン」: 非専門医の正診率を40%台から80%台へ引き上げる強力なツールですが、最終決定権は医師にあります。
  • 除外は人間の仕事: 二次性頭痛の見落としは致命的です。AIの結果にかかわらず、神経診察と画像診断の適応判断は医師が行ってください。

参考文献

  1. Katsuki M, Shimazu T, Kikui S, et al. Developing an artificial intelligence-based headache diagnostic model and its utility for non-specialists’ diagnostic accuracy. Cephalalgia. 2023;43(5):3331024231156925.
    PUBMED: https://pubmed.ncbi.nlm.nih.gov/37072919/
  2. Okada M, Katsuki M, Shimazu T, et al. Preliminary External Validation Results of the Artificial Intelligence-Based Headache Diagnostic Model: A Multicenter Prospective Observational Study. Life (Basel). 2024;14(6):744.
    PUBMED: https://pubmed.ncbi.nlm.nih.gov/38929727/
  3. Katsuki M, Matsumori Y, Kawamura S, et al. Developing an artificial intelligence-based diagnostic model of headaches from a dataset of clinic patients’ records. Headache. 2023;63(8):1097-1108.
    PUBMED: https://pubmed.ncbi.nlm.nih.gov/37596885/
※本ブログは、私個人の責任で執筆されており、所属する組織の見解を代表するものではありません。

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

About me
Neurolog
Neurolog
神経内科専門医・脳卒中専門医
急性期市中病院で勤務する脳神経内科医です。 得意分野は脳卒中・頭痛です。神経内科専門医・脳卒中専門医で、頭痛専門医を目指して研鑽中です。mJOHNSNOW Fellow(2期)。 医学論文をわかりやすく解説し、明日から使える実践知を発信します。個別の医療相談にはお答えできかねます。本サイトの投稿は個人的見解です。
記事URLをコピーしました