健康を科学で紐解く シリーズ42 「会話でパーキンソン病を診断」
- nextmizai
- 2023年5月13日
- 読了時間: 8分
更新日:2023年6月25日
未在 -Clinics that live in science.- では「生きるを科学する診療所」として、
「健康でいること」をテーマに診療活動を行っています。
根本治癒にあたっては、病理であったり、真の原因部位(体性機能障害[SD])の特定
(検査)が重要なキー(鍵)であると考えています。
このような観点から、健康を阻害するメカニズムを日々勉強しています。
人の「健康」の仕組みは、巧で、非常に複雑で、科学が発達した現代医学においても未知な世界にあります。
以下に、最新の科学知見をご紹介します。
会話でパーキンソン病を診断:
自然言語処理と機械学習による発話解析の成果
名古屋大学大学院医学系研究科神経内科学の勝野雅央教授、横井克典客員研究者(筆頭研究者、国立長寿医療研究センター脳神経内科)の研究グループは、愛知県立大学情報科学部の入部百合絵准教授、豊橋技術科学大学情報・知能工学系の北岡教英教授と共同で神経変性疾患※1のひとつであるパーキンソン病※2に関する研究、解析を行いました。
自然言語処理※3の技術を用いて会話内容の解析を行うことで、パーキンソン病患者の会話の特徴の把握と、自由会話テキストからのパーキンソン病の診断の可能性を検討しました。
パーキンソン病患者は、発声の障害や言語の障害など、様々な発話に関する問題に遭遇します。勝野教授らの本研究チームは、パーキンソン病における言語変化の病態生理学的メカニズムを解明するために、自然言語処理の技術を用いて、患者の発話と健常対照者の発話を比較しました。
本研究では、認知機能が正常なパーキンソン病患者 53 名と健常対照者 53 名の会話を録音し、その内容を文章に書き起こしました。次に、書き起こしたテキスト情報について自然言語処理を用いて分析し、さらに機械学習アルゴリズムを用いて各グループの会話の特徴を明らかにすることを試みました。この分析では、品詞と構文の複雑さに焦点を当てた 37 の特徴量を評価項目とし、サポートベクターマシン(SVM)※4を用い、10 分割交差検証法※5でこれらの特徴量のうち、パーキンソン病患者の会話の識別に有効な項目を絞り込み、各群の識別率についても検証しました。本研究での解析により、パーキンソン病患者は健常対照者群に比べ、1 文あたりの品詞数の数が少ないことがわかりました。また、パーキンソン病患者は健常対照者と比較して、会話文全体での動詞の割合、格助詞の分散(データのばらつきをしめす指標)、1 文あたりの動詞の割合が高く、1 文あたりの普通名詞、固有名詞、フィラー※6の割合が低いことがわかりました。
このような会話の変化を利用して、パーキンソン病患者または健常対照者のそれぞれの識別を試みたとき、その識別率はそれぞれ 80%以上でした。
本研究の結果から、パーキンソン病患者の会話には認知機能低下がなくとも健常者と比較して異常があることが示唆されました。このことから、会話内容について自然言語処理を用いて解析することがパーキンソン病の診断の一助となると考えられます。
研究の背景
パーキンソン病は、アルツハイマー病に次いで 2 番目に多い神経変性疾患です。比較的患者数が多い疾患であり、その有病率は年齢とともに増加します。
パーキンソン病は、動作緩慢、筋強剛、安静時振戦などの運動徴候と、認知、精神、睡眠、自律神経、感覚障害などの非運動徴候によって特徴づけられます。これらの症状に加え、パーキンソン病ではコミュニケーション上の変化もよく見られ、発話、音声、心理などさまざまな要因が影響します。
既報告によると、パーキンソン病患者の 90%以上が何らかの言語障害を経験していると考えられています。
本研究では、自然言語処理を用いて発話テキストを解析し、認知機能低下のないパーキンソン病患者における発話変容の病態生理的メカニズムを明らかにすることを目的としました。
研究の成果
2012 年 4 月から 2020 年 3 月にかけて、合計 73 名のパーキンソン病患者と 54 名の健常対象者を募集しました。このうち、パーキンソン病患者 17 名と健常対象者 1 名がデータ不足のため除外され、さらに、最終的にレビー小体型認知症と診断された患者 3 名も除外されました。結果として、パーキンソン病患者 53 名(男性 24 名、女性 39 名)、健常対象者 53 名(男性 24 名、女性 39 名)を解析対象としました。年齢、性別、教育年数、MoCA-J※7 の各値に関して、グループ間で有意な差は認めませんでした。
パーキンソン病群と健常対象者群の間で言語流暢性課題(「か」で始まる単語を 1 分間で、できるだけたくさん言ってください)や意味流暢性課題(動物の名前を 1 分間で、できるだけたくさん言ってください)に有意差はありませんでしたが、品詞の数はパーキンソン病群が健常者群より有意に少ないことがわかりました(表 1)。文の数に関しては、有意な群間差は見られませんでした。

表 1 各群の言語的特徴
次に Wrapper 法※8 を用いて、パーキンソン病群と健常対象者群を識別するための特徴量を選択する試行を 4 回実施しました。10 分割交差法の結果、3 回目の試行で、陽性的中率と陰性的中率のバランスを示す値である F 値が最も良好でした。感度※9、特異度※10、陽性的中率※11、陰性的中率※12は、3 回目の試行ですべて 0.83 を上回っていました(表 2)。

表 2 Wrapper 法 3 回目で選択された特徴量を用いた各群の識別の診断精度
以上の解析において、パーキンソン病患者と健常者を見分けるのに重要な手がかりとして、動詞の割合、格助詞の分散、1 文あたりの一般名詞、固有名詞、動詞、フィラーの 6 つの特徴量が選択されました。選択された特徴量を分析したところ、6 項目すべてでパーキンソン病群と健常者群との間に有意差が認められました(図 1)。

図 1 各特徴量のパーキンソン病患者と健常者の差
研究のまとめ(ポイント)
1.パーキンソン病患者は様々な発話に関する問題を有するが、自由会話のテキストの解析と
異常の報告はこれまでほとんど行われてこなかった。
2.パーキンソン病患者が話す 1 文の品詞数は健常者より少なく、パーキンソン病患者は健
常対照者に比べ、動詞の割合が高く、名詞、フィラーの割合が低かった。
3.抽出された特徴量を用いることで、80%以上の精度でパーキンソン病患者と健康な方を
見分けることができた。
4.自然言語処理はパーキンソン病患者の言語障害のメカニズムを解明し、診断精度を高める
ために有効な手段であることが示された。
今後の展開
本研究の結果より、認知障害のないパーキンソン病患者と健常者との間で、会話内容の差異があることが見出されました。具体的には、パーキンソン病患者の会話は健常者に比べて、①自発的な会話で 1 文に話す品詞の数が少なく 1 つの文章が短い、②動詞と格助詞(分散)が多く、名詞とフィラーが少ない、ということなどがわかりました(図 2)。この会話の変化を応用することで、サポートベクタマシンは 80%以上の精度でパーキンソン病と健常者を判別できることがわかりました。
これらの結果は、自然言語処理による言語解析の可能性を示唆し、パーキンソン病の診断に利用できる可能性を示唆しました。
今後、認知機能の低下を来したパーキンソン病患者の会話の解析や、パーキンソン病以外のアルツハイマー病を中心とする神経変性疾患の患者の会話の解析を自然言語処理により行っていく予定です。

図 2 Parkinson 病患者の会話への自然言語処理
用語説明
※1 神経変性疾患:特定の種類の神経細胞が進行性に変性する(死滅する)疾患の総称。
神経変性疾患に共通する病理学的な特徴として、神経細胞の中や周囲に異常な蛋白質が
蓄積し、それによって特定の種類の神経細胞が障害されることが知られている。
パーキンソン病、アルツハイマー病、筋萎縮性側索硬化症などが神経変性疾患の代表的
疾患。
※2 パーキンソン病:神経細胞内にαシヌクレインという異常な蛋白質が蓄積し、主に脳内
のドーパミン神経に障害を起こすことで、振戦(手足の震え)、筋強剛(筋肉や関節がか
たくなる)、動作緩慢、姿勢反射障害(転びやすくなる)などの運動症状を引き起こす進
行性の難病。
※3 自然言語処理:自然言語処理とは、人が日常的に使用している言語(自然言語)をコンピ
ュータで機械的に分析することです。様々な手法があります。
※4 サポートベクターマシン:2 クラス分類の線形識別(直線で区分けできること)関数を構
築する機械学習モデルの一種です。教師あり学習の分類と回帰で活用可能ですが、
おもに分類のタスクにおいて強力な効力を発揮します。
※5 10 分割交差法:データセットを 10 個に分割し,モデルの訓練と評価を 10 回行います.
得られた 10 個の評価値の平均をとった値を最終的なモデルのスコアとして扱う方法で
す.
※6 フィラー:「えーと」、「あのー」といった、それ自体には特に意味がない、間をつな
ぐためのつなぎ文句のこと。
※7 MoCA-J:軽度の認知障害を評価、早期発見するために開発された検査です。
10 分程度の短時間で軽度の認知機能障害の有無について評価することができます。
※8 Wrapper 法:複数の特徴を同時に使って予測精度の検証を行い、精度が最も高くなる
ような特徴量の組み合わせを探索する方法です。様々な組み合わせでそれぞれ学習を
行わせ、その学習結果をもとに組み合わせに優劣をつけて、有効な特徴量を選択しま
す。
※9 感度:ある疾患を持つ人のうち、検査で陽性と正しく判断される割合を感度と言いま
す。感度が高いということは、「疾患を持つ人を、陽性と正しく判定する可能性が高
い」ということになります。
※10 特異度:検査で陰性を正しく判断される割合を指します。特異度が高いということは、
「疾患を持たない人を、陰性と正しく判定する可能性が高い」ということになります。
※11 陽性的中率:全ての陽性者のうち、実際に陽性だったものを正しく陽性と判定できた
割合のことです。
※12 陰性的中率:全ての陰性者のうち、実際に陰性だったものを正しく陰性と判定できた
割合のことです。
Comentarios