official-blog:260210-neuromodulation

260210 ニューロモジュレーション:脳が何を行い、トランスフォーマーが何を行わず、Neuraxonが何を試みるのか

執筆:Qubicサイエンスチーム / 公開日:2026年2月10日

Neuraxon Intelligence Academy — Volume 3

1. 脳におけるニューロモジュレーション:適応型知能の基盤

 ニューロモジュレーション(神経修飾)とは、神経系の基本構造を変えることなく、その機能が刻一刻とどのように変化するかを調節する一連のメカニズムを指します。ニューロモジュレーションのおかげで、脳は学習を速めたり遅くしたり、探索的になったり保守的になったり、あるいは新しいものに心を開いたり既知のものに集中したりすることができます。配線(配線図)は変わりません。変わるのは、その配線の「使われ方」です。

 この概念は、脳からインスピレーションを得たAI、および Qubic の Neuraxon の背後にあるアーキテクチャを理解する上で中心的な役割を果たします。

イオノトロピック受容体 vs メタボトロピック受容体:神経シグナルの2つの時間スケール

 ニューロモジュレーションを正しく理解するには、脳内における2つの化学的作用の形式を区別することが不可欠です。

 一方には、グルタミン酸GABAのように、イオノトロピック(イオンチャネル型)受容体に作用する神経伝達物質があります。これらの受容体はイオンチャネルです。活性化されると、ミリ秒単位でニューロンに即座に電気的な変化を引き起こします。これは神経計算の「高速レベル」に相当します。具体的な情報が伝達され、感覚信号が統合され、迅速な意思決定が行われ、知覚、運動、リアルタイムの思考を支えるニューロン活動が生成されます。

 他方には、ドーパミンノルアドレナリンセロトニンアセチルコリンなどの神経伝達物質があり、それらの主な作用はメタボトロピック(代謝型)受容体を通じて発揮されます。これらの受容体は直接電気信号を生成しません。代わりに、細胞内シグナル伝達の連鎖を活性化し、数秒、数分、あるいはそれ以上の長い時間にわたってニューロンの内部特性を修正します。これは神経処理の「低速ダイナミクス・レベル」を代表しており、脳が適応し学習する方法の根本となります。

 この違いを直感的に理解する方法は、「海港」のメタファーを用いることです。

 イオノトロピック受容体は、素早く出入りするスイマーやサーファー、あるいは小さなボートのようなものです。対照的に、メタボトロピック受容体は大型の貨物船のようなものです。それらが接岸するには許可が必要で、調整が求められ、港の物流全体を調整しなければなりません。

 これらのメタボトロピック受容体は、シナプス可塑性やニューロンの反応しやすさを変化させます。この「遅い修飾」は情報を伝達するのではなく、システムの「内部ルール」を修正するのです。

4つのニューロモジュレーター:ドーパミン、ノルアドレナリン、セロトニン、アセチルコリン

 ここで、主要なニューロモジュレーション・システムが登場します。これら4つの神経伝達物質は、脳が情報を処理し、学習し、適応する方法を調節する上でそれぞれ異なる役割を果たします:

  • ドーパミン:
    • 主に腹側被蓋野と黒質から発生し、快楽そのものをシグナルするのではなく、「何が学習に関連しているか」をシグナルします。システムのエラーや新規性に対する感受性を調整します。Schultz (2016) がドーパミン報酬予測誤差コーディングの基礎研究で示したように、ドーパミンは期待された結果と実際の結果の差をシグナルします。これは生物・人工システム両方の強化学習にとって重要なメカニズムです。
  • ノルアドレナリン (Norepinephrine):
    • 主に青斑核から放出され、覚醒度と「探索(新しいことを試す)」と「搾取(既存の知識を利用する)」のバランスを調節します。このトーンが高いとき、脳は予期せぬ変化に対してより敏感になり、ルーチンに固執しなくなります。これは、青斑核・ノルアドレナリン機能を適応ゲイン制御と不確実性下での意思決定に関連付けた Aston-Jones & Cohen (2005) の統合理論と一致します。
  • セロトニン:
    • 縫線核から発生し、気分、睡眠、抑制、行動の安定性を修飾します。Dayan & Huys (2009) で探求されているように、セロトニンはシステムに急速な学習を促すのではなく、むしろ待つこと、衝動的な反応を避けること、そして環境が不確実な際に行動を維持することを促します。忍耐と長期計画において重要な役割を果たします。
  • アセチルコリン:
    • 脳幹のマイネルト基底核から放出され、注意とコンテキスト(文脈)依存の学習において中心的な役割を果たします。皮質ネットワークを関連する感覚情報に対して開放し、環境がそれを要求するときにシナプス可塑性を可能にします。新しいことを学ばなければならない時に特に重要であり、適応的神経計算に不可欠です。

 これらの一連のアクションのおかげで、ニューロモジュレーションの状態によって、同じ刺激が異なる反応を生み出すことができます。回路は同じですが、その「動作方法」が変わるのです。脳が注意を払っている時と疲労している時で同じように反応しない理由、またルーチン的な状況と新規性や驚きに直面した時で同じように学習しない理由がここにあります。

メタレベル:可塑性の窓と適応学習

 さらに、神経調節の「メタレベル」として理解できる、第3のより深いレベルが存在します。このレベルはニューロン活動やその速度を直接調節するのではなく、システムが持続的に変化できる「条件」を調節します。脳内では、ニューロン間の同時活動が必ずしも学習を保証するわけではありません。接続が強まったり弱まったりするには、ニューロモジュレーションの状態がそれを許可しなければなりません。それはまるで、「今はイエス」「今はノー」という静かなシグナルがあるかのようです。

 このように、ニューロモジュレーションは「可塑性の窓」を開閉するシステムとして機能し、エラー、経験、あるいは偶然の一致をいつ統合(定着)させるべきかを決定します。高速、低速、およびメタというこの多重スケール・アーキテクチャが存在するのは、知能システムが常に同じルールを適用できるわけではないからです。Marder (2012) がその記念碑的なレビューで説明したように、神経回路のニューロモジュレーションこそが、脳がアーキテクチャを再構築することなく行動の柔軟性を達成する方法なのです。

 身体の状態、エネルギーレベル、疲労、痛みは内部環境の一部です。新規性、脅威、機会、反復、予測可能性は外部環境の一部です。ニューロモジュレーション・システムは、これらの条件を機能的状態へと翻訳します。ドーパミン、ノルアドレナリン、セロトニン、アセチルコリンを通じて、脳はある状況が学習に値するか、注意が必要か、探索か保存のどちらが好ましいか、そしてエラーが有益な情報なのか単なるノイズなのかを評価します。環境が反応を直接規定するのではなく、環境が脳の「反応ルール」を修飾するのです。この原理は、Friston (2010) が「自由エネルギー原理」として記述したものの核心にあります。これは、脳が適応的な内部モデルを通じて常に驚きを最小化していることを示唆する統一的な枠組みです。

2. なぜ大規模言語モデルやトランスフォーマー・アーキテクチャにはニューロモジュレーションが欠けているのか

 大規模言語モデル(LLM)やトランスフォーマー(Transformer)ベースのアーキテクチャは、ニューロモジュレーションを備えていません。これらは長いシーケンスを処理し、自然言語処理において驚異的なパフォーマンスを達成していますが、推論中にモデルの動作レジームを動的に調節するシステムを欠いています。

トランスフォーマー型AIシステムの静的な性質

 LLMにおける学習は、使用時とは完全に切り離された「トレーニングフェーズ」で行われます。重みはエラーのバックプロパゲーション(誤差逆伝播)を通じて調整され、トレーニングが完了すると、モデルは固定された状態(Static State)になります。推論中には可塑性は存在せず、文脈に応じた持続的な変化も起こりません。システムは動作中に学習を行わないため、いつ学習が適切でいつ安定化させるべきかを判断しません。これは最近の研究が裏付けている根本的な限界であり、LLMは真の「内部世界モデル」や「リアルタイムに適応する能力」を欠いています。

 ニューロモジュレーションに触発されたいくつかのアプローチは、トレーニング中に学習率(learning rate)を調整したり、サブネットワークを活性化/非活性化したり、活性化関数を修飾したりすることで、特定の効果をシミュレートしようとしています。しかし、これらは単なる外部的な最適化に過ぎず、活動と可塑性をリアルタイムで調節する内部システムではありません。Mei, Müller & Ramaswamy (2022) が Trends in Neurosciences で論じたように、ニューロモジュレーション・システムの多重スケール原理に基づいてディープニューラルネットワークに情報を提供することは、現在のLLMアーキテクチャが対処できていない未解決の課題のままです。

 AIの文脈でニューロモジュレーションが言及されることもありますが、LLMやトランスフォーマーはあくまで部分的な近似に留まっており、脳に匹敵するシステムではありません。静的な行列演算と、生物学的神経ネットワークに見られる動的で状態依存の調節との間の「隔たり」こそが、Neuraxon のような脳にインスパイアされたAIアーキテクチャを、適応型人工知能に向けた必要な次のステップにしているのです。

3. Neuraxonがニューロモジュレーションをどのように計算するか:脳にインスパイアされたAIアーキテクチャ

 Neuraxon において、計算とは連続的な時間の中で展開されるプロセスです。コードは、明確な外部刺激がない場合でも進化し続ける「内部状態」 $s(t)$ を維持するシステムを表現しています。これらの状態が将来の行動に影響を与え、常に活動し続ける「生きた神経システム」を作り出します。これについては、Neuraxon の研究論文で詳しく探求されています。

神経計算における高速、低速、およびメタ・ダイナミクス

 Neuraxon は、生物学的な脳に見られる多重スケール時間アーキテクチャを反映し、高速(Fast)、低速(Slow)、およびメタ(Meta)ダイナミクスを明示的に組み込んでいます。

  • 高速ダイナミクス:
    • イオノトロピック受容体を介した迅速な神経シグナル伝達と同様に、活動の即時的な伝搬を制御します。
  • 低速ダイナミクス:
    • パターンの蓄積、持続、および安定化を導入します。
    • これにより、システムは瞬間の先まで情報を保持することができ、メタボトロピック受容体が数秒から数分にわたって神経機能を修飾する方法に似ています。
  • メタ・ダイナミクス:
    • 前述の2つの間の相互作用ルールに作用し、システムが変化に対してより敏感になる時期や、状態を維持しようとする時期を修飾します。

 Neuraxon におけるニューロモジュレーションは、外部的なパラメータ調整として実装されているのではありません。システムは「何を学ぶか」を明示的に決定するのではなく、むしろ「どのような条件下で変化できるか」を決定します。これは、ドーパミンやセロトニンなどの生物学的ニューロモジュレーターが情報を直接エンコードするのではなく、可塑性の窓を作り出す方法を反映しています。これらのダイナミクスは、HuggingFace Spacesにあるインタラクティブな Neuraxon 3Dシミュレーションで実際に体験できます。そこでは、ドーパミン、セロトニン、アセチルコリン、ノルアドレナリンのレベルをリアルタイムで調整し、それらがネットワークの挙動にどのように影響するかを観察できます。

生物学的原理から分散型AIへ

 このアプローチは、脳の分子的・解剖学的な複雑さを再現するものではありません(それは現在再現不可能です)。数千の受容体や本物の生物学的ネットワークは存在しません。しかし、Neuraxonは本質的な原理を維持し、計算しています。それは、「知能とは適応的であり、したがって内部ダイナミクス、状態、および修飾が必要である」という原理です。

 Neuraxon のニューロモジュレーション・アーキテクチャは、分散型AIという Qubic のより広いビジョンの中核部分です。

 NeuraxonAIGarth の「Intelligent Tissue(知能組織)」進化フレームワークと統合することで、Qubicは、Qubicネットワークの有用な仕事の証明(uPoW)コンセンサスメカニズムを活用した分散コンピューティングを通じて、数百万の Neuraxon ベースのアーキテクチャが進化し、競合し、改善されるシステムを構築しています。

4. インタラクティブ・デモでニューロモジュレーターを探索する

 脳にインスパイアされたAIシステムでニューロモジュレーションがどのように機能するかを体験してみませんか?

 Neuraxon Mood Mixer デモでは、ドーパミン、セロトニン、アセチルコリン、ノルアドレナリンのレベルをリアルタイムで調整し、これらのニューロモジュレーターがニューラルネットワークの挙動にどのように影響するかを観察できます。静的なAI計算と、動的で状態依存の処理の違いを理解するための実践的な方法です。

5. Neuraxonの多重スケール・ニューロモジュレーションを支える数学

 Neuraxon における時間的ダイナミクスは、神経計算の高速、低速、メタの時間スケールを捉える3つの微分方程式によって制御されています:

 ここで、$\tau_{fast} < \tau_{slow} < \tau_{meta}$ はそれぞれの異なる時間スケールを反映しており、$\tau_{meta}$ はメタボトロピック効果の「超低速」な性質を捉えるために著しく大きくなっています。この数学的枠組みは、Northoff & Huang (2017) が脳の時間ダイナミクスがいかに意識を媒介するかについて述べたように、ニューロモジュレーションが高速なシナプス伝達よりもはるかに遅い時間スケールで動作するという生物学的原理を直接実装しています。

学術参考文献

  • Dayan, P., & Huys, Q. J. M. (2009). Serotonin, inhibition, and negative mood. PLoS Computational Biology.
  • Marder, E. (2012). Neuromodulation of neuronal circuits: back to the future. Neuron.
  • Schultz, W. (2016). Dopamine reward prediction error coding. Dialogues in Clinical Neuroscience.
  • Aston-Jones, G., & Cohen, J. D. (2005). An integrative theory of locus coeruleus–norepinephrine function. Annual Review of Neuroscience.
  • Mei, L., Müller, E., & Ramaswamy, S. (2022). Informing deep neural networks by multiscale principles of neuromodulatory systems. Trends in Neurosciences.
  • Friston, K. (2010). The free-energy principle: a unified brain theory? Nature Reviews Neuroscience.
  • Northoff, G., & Huang, Z. (2017). How do the brain’s time and space mediate consciousness and its disorders? Consciousness and Cognition.

【要約】Neuraxonとニューロモジュレーション:次世代AIの設計図

 Qubic の AIアーキテクチャ「Neuraxon」の根幹を成す「ニューロモジュレーション(神経修飾)」の概念を凝縮して解説します。

1. 脳の柔軟性を支える3つの動的階層

 脳は配線を変えずに、状況に応じて「動作ルール」を書き換えます。これが知能の適応性です。

レイヤー 生物学的対応 Neuraxonでの役割
高速 (Fast) イオノトロピック受容体 即時的な情報伝達と反応生成。
低速 (Slow) メタボトロピック受容体 数秒〜数分単位の内部状態の安定化と蓄積。
メタ (Meta) 可塑性の窓 (Plasticity) 「いつ、どのような条件で学習(変化)すべきか」の制御。

2. 主要な4つの神経修飾因子 (Neuromodulators)

 Neuraxon は、これら4つの因子をシステム全体の「動作モード」を切り替えるパラメータとして統合しています。

  • ドーパミン:
    • 「学習の関連性」を定義。期待と結果の誤差(報酬予測誤差)を処理。
  • ノルアドレナリン:
    • 「覚醒と探索」の制御。ルーチンを捨てるべきタイミングを判断。
  • セロトニン:
    • 「忍耐と安定」の維持。不確実な状況での衝動的反応を抑制。
  • アセチルコリン:
    • 「注意と可塑性」の開放。新しい情報の取り込みを促進。

3. LLM(静的) vs Neuraxon(動的)

 現在の主流であるトランスフォーマー型AI(LLM)と、Neuraxon の決定的な違いです。

特徴 一般的なLLM (GPT等) Neuraxon (Qubic)
学習タイミング トレーニング時のみ(事前学習) 推論(実行)中も継続的に適応
状態の維持 静的な行列演算(重み固定) 動的な内部状態 $s(t)$ を維持
適応性 文脈(プロンプト)への一時的反応 ニューロモジュレーションによる状態遷移

4. Neuraxonを支える数学的基盤

 Neuraxon は、時間スケールの異なる微分方程式によって「生きている神経系」を計算します。

$$ \tau_{fast} < \tau_{slow} < \tau_{meta} $$

 この時間的格差こそが、情報処理(速い)と学習・適応(遅い)を両立させる鍵となります。


まとめ:
 Neuraxon は単なる「計算機」ではなく、Qubicネットワークの uPoW(有用な仕事の証明) を通じて、環境に適応し、自己修飾を繰り返す「知能組織(AIGarth)」の一部として機能します。

official-blog/260210-neuromodulation.txt · 最終更新: by d.azuma