Epoch 200
原文 Neuromodulation: What the Brain Does, What Transformers Do Not, and What Neuraxon Attempts | Qubic Blog
執筆:Qubicサイエンスチーム / 公開日:2026年2月10日
Neuraxon Intelligence Academy — Volume 3
ニューロモジュレーション(神経修飾)とは、神経系の基本構造を変えることなく、その機能が刻一刻とどのように変化するかを調節する一連のメカニズムを指します。ニューロモジュレーションのおかげで、脳は学習を速めたり遅くしたり、探索的になったり保守的になったり、あるいは新しいものに心を開いたり既知のものに集中したりすることができます。配線(配線図)は変わりません。変わるのは、その配線の「使われ方」です。
この概念は、脳からインスピレーションを得たAI、および Qubic の Neuraxon の背後にあるアーキテクチャを理解する上で中心的な役割を果たします。
ニューロモジュレーションを正しく理解するには、脳内における2つの化学的作用の形式を区別することが不可欠です。
一方には、グルタミン酸やGABAのように、イオノトロピック(イオンチャネル型)受容体に作用する神経伝達物質があります。これらの受容体はイオンチャネルです。活性化されると、ミリ秒単位でニューロンに即座に電気的な変化を引き起こします。これは神経計算の「高速レベル」に相当します。具体的な情報が伝達され、感覚信号が統合され、迅速な意思決定が行われ、知覚、運動、リアルタイムの思考を支えるニューロン活動が生成されます。
他方には、ドーパミン、ノルアドレナリン、セロトニン、アセチルコリンなどの神経伝達物質があり、それらの主な作用はメタボトロピック(代謝型)受容体を通じて発揮されます。これらの受容体は直接電気信号を生成しません。代わりに、細胞内シグナル伝達の連鎖を活性化し、数秒、数分、あるいはそれ以上の長い時間にわたってニューロンの内部特性を修正します。これは神経処理の「低速ダイナミクス・レベル」を代表しており、脳が適応し学習する方法の根本となります。
この違いを直感的に理解する方法は、「海港」のメタファーを用いることです。
イオノトロピック受容体は、素早く出入りするスイマーやサーファー、あるいは小さなボートのようなものです。対照的に、メタボトロピック受容体は大型の貨物船のようなものです。それらが接岸するには許可が必要で、調整が求められ、港の物流全体を調整しなければなりません。
これらのメタボトロピック受容体は、シナプス可塑性やニューロンの反応しやすさを変化させます。この「遅い修飾」は情報を伝達するのではなく、システムの「内部ルール」を修正するのです。
ここで、主要なニューロモジュレーション・システムが登場します。これら4つの神経伝達物質は、脳が情報を処理し、学習し、適応する方法を調節する上でそれぞれ異なる役割を果たします:
これらの一連のアクションのおかげで、ニューロモジュレーションの状態によって、同じ刺激が異なる反応を生み出すことができます。回路は同じですが、その「動作方法」が変わるのです。脳が注意を払っている時と疲労している時で同じように反応しない理由、またルーチン的な状況と新規性や驚きに直面した時で同じように学習しない理由がここにあります。
さらに、神経調節の「メタレベル」として理解できる、第3のより深いレベルが存在します。このレベルはニューロン活動やその速度を直接調節するのではなく、システムが持続的に変化できる「条件」を調節します。脳内では、ニューロン間の同時活動が必ずしも学習を保証するわけではありません。接続が強まったり弱まったりするには、ニューロモジュレーションの状態がそれを許可しなければなりません。それはまるで、「今はイエス」「今はノー」という静かなシグナルがあるかのようです。
このように、ニューロモジュレーションは「可塑性の窓」を開閉するシステムとして機能し、エラー、経験、あるいは偶然の一致をいつ統合(定着)させるべきかを決定します。高速、低速、およびメタというこの多重スケール・アーキテクチャが存在するのは、知能システムが常に同じルールを適用できるわけではないからです。Marder (2012) がその記念碑的なレビューで説明したように、神経回路のニューロモジュレーションこそが、脳がアーキテクチャを再構築することなく行動の柔軟性を達成する方法なのです。
身体の状態、エネルギーレベル、疲労、痛みは内部環境の一部です。新規性、脅威、機会、反復、予測可能性は外部環境の一部です。ニューロモジュレーション・システムは、これらの条件を機能的状態へと翻訳します。ドーパミン、ノルアドレナリン、セロトニン、アセチルコリンを通じて、脳はある状況が学習に値するか、注意が必要か、探索か保存のどちらが好ましいか、そしてエラーが有益な情報なのか単なるノイズなのかを評価します。環境が反応を直接規定するのではなく、環境が脳の「反応ルール」を修飾するのです。この原理は、Friston (2010) が「自由エネルギー原理」として記述したものの核心にあります。これは、脳が適応的な内部モデルを通じて常に驚きを最小化していることを示唆する統一的な枠組みです。
大規模言語モデル(LLM)やトランスフォーマー(Transformer)ベースのアーキテクチャは、ニューロモジュレーションを備えていません。これらは長いシーケンスを処理し、自然言語処理において驚異的なパフォーマンスを達成していますが、推論中にモデルの動作レジームを動的に調節するシステムを欠いています。
LLMにおける学習は、使用時とは完全に切り離された「トレーニングフェーズ」で行われます。重みはエラーのバックプロパゲーション(誤差逆伝播)を通じて調整され、トレーニングが完了すると、モデルは固定された状態(Static State)になります。推論中には可塑性は存在せず、文脈に応じた持続的な変化も起こりません。システムは動作中に学習を行わないため、いつ学習が適切でいつ安定化させるべきかを判断しません。これは最近の研究が裏付けている根本的な限界であり、LLMは真の「内部世界モデル」や「リアルタイムに適応する能力」を欠いています。
ニューロモジュレーションに触発されたいくつかのアプローチは、トレーニング中に学習率(learning rate)を調整したり、サブネットワークを活性化/非活性化したり、活性化関数を修飾したりすることで、特定の効果をシミュレートしようとしています。しかし、これらは単なる外部的な最適化に過ぎず、活動と可塑性をリアルタイムで調節する内部システムではありません。Mei, Müller & Ramaswamy (2022) が Trends in Neurosciences で論じたように、ニューロモジュレーション・システムの多重スケール原理に基づいてディープニューラルネットワークに情報を提供することは、現在のLLMアーキテクチャが対処できていない未解決の課題のままです。
AIの文脈でニューロモジュレーションが言及されることもありますが、LLMやトランスフォーマーはあくまで部分的な近似に留まっており、脳に匹敵するシステムではありません。静的な行列演算と、生物学的神経ネットワークに見られる動的で状態依存の調節との間の「隔たり」こそが、Neuraxon のような脳にインスパイアされたAIアーキテクチャを、適応型人工知能に向けた必要な次のステップにしているのです。
Neuraxon において、計算とは連続的な時間の中で展開されるプロセスです。コードは、明確な外部刺激がない場合でも進化し続ける「内部状態」 $s(t)$ を維持するシステムを表現しています。これらの状態が将来の行動に影響を与え、常に活動し続ける「生きた神経システム」を作り出します。これについては、Neuraxon の研究論文で詳しく探求されています。
Neuraxon は、生物学的な脳に見られる多重スケール時間アーキテクチャを反映し、高速(Fast)、低速(Slow)、およびメタ(Meta)ダイナミクスを明示的に組み込んでいます。
Neuraxon におけるニューロモジュレーションは、外部的なパラメータ調整として実装されているのではありません。システムは「何を学ぶか」を明示的に決定するのではなく、むしろ「どのような条件下で変化できるか」を決定します。これは、ドーパミンやセロトニンなどの生物学的ニューロモジュレーターが情報を直接エンコードするのではなく、可塑性の窓を作り出す方法を反映しています。これらのダイナミクスは、HuggingFace Spacesにあるインタラクティブな Neuraxon 3Dシミュレーションで実際に体験できます。そこでは、ドーパミン、セロトニン、アセチルコリン、ノルアドレナリンのレベルをリアルタイムで調整し、それらがネットワークの挙動にどのように影響するかを観察できます。
このアプローチは、脳の分子的・解剖学的な複雑さを再現するものではありません(それは現在再現不可能です)。数千の受容体や本物の生物学的ネットワークは存在しません。しかし、Neuraxonは本質的な原理を維持し、計算しています。それは、「知能とは適応的であり、したがって内部ダイナミクス、状態、および修飾が必要である」という原理です。
Neuraxon のニューロモジュレーション・アーキテクチャは、分散型AIという Qubic のより広いビジョンの中核部分です。
Neuraxon を AIGarth の「Intelligent Tissue(知能組織)」進化フレームワークと統合することで、Qubicは、Qubicネットワークの有用な仕事の証明(uPoW)コンセンサスメカニズムを活用した分散コンピューティングを通じて、数百万の Neuraxon ベースのアーキテクチャが進化し、競合し、改善されるシステムを構築しています。
脳にインスパイアされたAIシステムでニューロモジュレーションがどのように機能するかを体験してみませんか?
Neuraxon Mood Mixer デモでは、ドーパミン、セロトニン、アセチルコリン、ノルアドレナリンのレベルをリアルタイムで調整し、これらのニューロモジュレーターがニューラルネットワークの挙動にどのように影響するかを観察できます。静的なAI計算と、動的で状態依存の処理の違いを理解するための実践的な方法です。
Neuraxon における時間的ダイナミクスは、神経計算の高速、低速、メタの時間スケールを捉える3つの微分方程式によって制御されています:
ここで、$\tau_{fast} < \tau_{slow} < \tau_{meta}$ はそれぞれの異なる時間スケールを反映しており、$\tau_{meta}$ はメタボトロピック効果の「超低速」な性質を捉えるために著しく大きくなっています。この数学的枠組みは、Northoff & Huang (2017) が脳の時間ダイナミクスがいかに意識を媒介するかについて述べたように、ニューロモジュレーションが高速なシナプス伝達よりもはるかに遅い時間スケールで動作するという生物学的原理を直接実装しています。
Qubic の AIアーキテクチャ「Neuraxon」の根幹を成す「ニューロモジュレーション(神経修飾)」の概念を凝縮して解説します。
脳は配線を変えずに、状況に応じて「動作ルール」を書き換えます。これが知能の適応性です。
Neuraxon は、これら4つの因子をシステム全体の「動作モード」を切り替えるパラメータとして統合しています。
現在の主流であるトランスフォーマー型AI(LLM)と、Neuraxon の決定的な違いです。
Neuraxon は、時間スケールの異なる微分方程式によって「生きている神経系」を計算します。
この時間的格差こそが、情報処理(速い)と学習・適応(遅い)を両立させる鍵となります。
まとめ: Neuraxon は単なる「計算機」ではなく、Qubicネットワークの uPoW(有用な仕事の証明) を通じて、環境に適応し、自己修飾を繰り返す「知能組織(AIGarth)」の一部として機能します。