top of page

健康を科学で紐解く シリーズ123 「AIとの比較から学習のコツをつかむ脳のメカニズムを解明」


未在 -Clinics that live in science.- では「生きるを科学する診療所」として、

「健康でいること」をテーマに診療活動を行っています。

根本治癒にあたっては、病理であったり、真の原因部位(体性機能障害[SD])の特定

(検査)が重要なキー(鍵)であると考えています。

このような観点から、健康を阻害するメカニズムを日々勉強しています。


人の「健康」の仕組みは、巧で、非常に複雑で、科学が発達した現代医学においても未知な世界にあります。


以下に、最新の科学知見をご紹介します。


 



AIとの比較から学習のコツをつかむ脳のメカニズムを解明




研究の概要


 自分の学習能力を客観的に監視・制御し、向上させる能力を「メタ認知」と呼びます。

人工知能との比較から、ヒトの脳には報酬情報に基づく運動学習のメタ認知能力が備わっていることを示しました。報酬(罰)の与え方によって、学習能力の変容の様子が異なる非対称性があることも分かりました。

勉強が出来るようになるコツは、自分の学習能力を客観的に監視・制御することです。このような能力は教育心理学で「学習の学習」や「メタ認知」と呼ばれてきました。しかし、その脳内メカニズムの理解は十分に進んでいません。認知能力の監視と制御という再帰的な構造を持つため、構成要素を分割して調べる還元主義的なアプローチが困難であったことが影響していると考えられます。


本研究では、人工知能(AI)とヒトのメタ認知を比較することで、研究パラダイム上の問題を克服しようとしました。

まず、金銭的な報酬の最大化と罰の最小化を目指す人工知能のメタ認知システムは、環境やタスクに応じて学習のスピードや記憶の保持能力を適切に調節できることを示しました。

次に、運動スキルの上達を目的とした運動学習課題を実施中のヒトに金銭的報酬を与えることで、運動学習のスピードと記憶の保持能力を高めたり、抑制したりできることを世界で初めて示しました。これは、ヒトの脳に、報酬情報に基づく運動学習のメタ認知能力が備わっていることを示唆しています。その一方、人工知能は報酬情報と罰情報に対して同等のメタ認知能力を発揮していたのに対し、ヒトは報酬情報によって記憶の保持時間を調整し、罰情報によって学習スピードを調整するという非対称的な特性を有することが明らかになりました。非対称的であるという特性は、ヒトのメタ認知の脳内メカニズムを理解する上で重要なヒントになると考えられます。


 これらの結果は、ヒトが未経験のスポーツ種目に取り組む場合や、リハビリテーションで新しい身体構造に適応する運動スキルを獲得する際に、効率的に学習能力を高めることができるようにする技術開発に貢献することが期待されます。




研究の背景


 トップアスリートの活躍を見ると、新しい運動スキルを学ぶ能力(運動学習能力)は生まれながらにして固有のもので、後天的な訓練によってはそれほど改善しないと思いがちです。しかし、運動学習注1)に関する多くの研究報告によれば、運動学習能力はさまざまな要素によって大きく変わることが明らかとなっています。例えば,トレーニング2日目の学習スピードの方が1日目の学習スピードよりも速くなる現象が多数報告されています。また,学習スピードが環境の変動や金銭的報酬によっても多様に変化することが近年明らかになってきました。


このような現象を説明するために、さまざまな理論が個別に提案されてきましたが、互いに矛盾しているため,背景にある脳内機序は未解明のままでした.また,これらの理論は、いずれも学習回数や環境の変化などの外的要因に影響を受ける受動的な学習能力変容を想定しているため,脳が運動学習能力を能動的に調節する方法は明らかにされていませんでした。


 本研究チームは、このような運動スキルの学習能力の変化は、教育心理学で研究されてきたようなメタ認知注2)によって能動的に調整されていると考えました。




研究内容と成果


 本研究チームは、人工知能研究で理論化されたメタ認知メカニズムが、ヒトの脳内でも実現されているという仮説を設定しました。人工知能のメタ認知メカニズムは、全体として長期的な報酬の最大化を図るため、上位の強化学習システムが下位の学習システムを監視・制御し、下位システムの学習パラメータを調整することにより「学習の学習」を実現しています。


本研究チームは、人工知能のこのメタ認知の理論を、運動軌道の誤差を最小化するメカニズムとして理論化されているヒトの運動学習の学習スピードと記憶の保持時間に適用し、運動学習のメタ認知の理論式を導きました。導いた理論式は、運動軌道の予測誤差と、学習の結果得られる報酬情報を統合することにより、運動学習スピードを表すパラメータを逐次的に更新します。この理論と整合性のあるメタ認知能力をヒトが示せば、人工知能のメタ認知と同じような、上位の強化学習システムが下位の運動学習システムを監視・制御するメカニズムがヒトの脳に備わっていることを意味します(参考図)。


図 本研究の概念図


ヒトには、運動学習メカニズムを監視・制御する人工知能(強化学習システム)と同様に、タスクや環境に応じて適切に運動学習の学習スピードと記憶の忘却スピードを柔軟に調整する「メタ認知」メカニズムが備わっていることが明らかになった。



 この予測を検証するために、ヒトが報酬情報に基づいて実際に「学習の学習」を実現することが可能かを、バーチャルリアリティ(VR)装置を用いた運動学習実験によって検証しました。この装置では、本当の手の位置からずれた位置に手先位置を表示することができます。従って、意図した手先位置の運動軌道と、観測する手先軌道にズレが生じます(外乱)。ヒトは、この外乱を補償し、運動軌道を目標に到達させるように、運動軌道を調整するような運動記憶を形成することが分かっています。


実験では、参加者が運動軌道を調整するために形成した運動記憶を推定し、記憶の形成に伴って報酬情報(お金など)を与えました。その結果、記憶の更新量が大きい場合に報酬のお金を増やす操作をすると、学習が促進されることが分かりました。逆に、記憶の更新量が小さい場合にお金を増やす操作をすると、学習は抑制されました。このように「学習の学習」の訓練によって、ヒトの運動学習能力を任意に統制(増強も減弱も)できることを実験的に示したのは、世界で初めてです。


この結果は、記憶と学習能力を客観的に観測したうえで、金銭的評価に基づいて制御するようなフィードバック制御構造を脳が有していることを示唆しています。さらに興味深いのは、金銭フィードバックをゼロから加算していくのか(報酬)、それとも最大値から減算していくのか(罰)によって学習能力の変容の様子が全く異なることが明らかになったことです。罰の場合には出来るだけ罰が少なくなるように学習スピードを調整(条件に応じて学習を加速したり減速したり)していたのに対して、報酬の場合には報酬が増加するように記憶の忘却の程度を調整(条件に応じて、忘れやすくしたり、忘れにくくしたり)することが分かりました。人工知能が報酬情報と罰情報に対して同等のメタ認知能力を発揮するのとは、大きな違いです。


このように、常に報酬の最大化を実現する人工知能との対比から、ヒトの認知メカニズム特有の性質が明確に浮かび上がります。そして、今回明らかになったヒトのメタ認知の報酬・罰に対する非対称性が、メタ認知の脳内機構を解明する際に重要なヒントになると考えられます。




今後の展開


 メタ認知はヒトの意識機能の重要な構成要素です。数学や英語の学習などと違い、運動学習を監視・制御するメタ認知機能は、運動記憶、誤差や報酬情報のように要素分解が可能で、要素間の相互作用も明確に定義できます。

このような意味で、運動スキルの「学習の学習」メカニズムは、メタ認知の最小単位であると言えます。そして、このような最小メタ認知を理論化し、行動実験を確立し、脳内メカニズムを明らかにすることで、これまで謎に包まれていたヒトの意識機能の本質をシステム論的に明らかにすることが可能になります。

また、運動学習の能力は、我々の日常生活の多くと関係します。例えばブレーキの踏み間違いのような感覚運動機能の衰えに対して、メタ認知機能に介入することにより、より効率的に改善を導くような応用研究が期待できます。




用語解説


注1) 運動学習


運動スキルが上達するように、練習を通じて身体の特性を把握し、その特性を活用した最も良い運動軌道パターンを生成するように、逐次的に運動軌道を更新するプロセス。


注2) メタ認知


上位の認知機能が下位の認知機能を監視・制御するような階層性によって特徴づけられる高次認知機能のこと。学習機能を監視・制御する機能は、メタ認知の代表的機能である。これにより、効率良く学習するための戦略作りや調整が行われている。

Comments


Commenting has been turned off.
bottom of page