official-blog:260127-beyond-binary

260127 二進法を超えて:生命の知性のモデルとしての三進法ダイナミクス

執筆:Qubic Scientific Team 公開日:2026年1月27日


脳は動的であり、非二進法的である

 生物学的な脳のネットワークは、活性化(ON)と静止(OFF)を切り替える決定スイッチとしては機能しません。生命システムにおいて、不活性であること自体がダイナミズムを内包しています。絶対的な「静止」は生命とは相容れません。第1章で見たように、生命は時間の中で展開されます。

 個々のニューロンは、他のニューロンを抑制または興奮させるために電流を送信する「全か無か(all-or-nothing)」のイベントとして現れるかもしれません。

 しかし、その送信(活動電位)に至る以前に、ニューロンは樹状突起と呼ばれる領域で正と負の入力を継続的に受け取っています。もしこれらの入力の総和がある閾値を超えると、物理的な構造変化が起こり、電流が軸索に沿って次のニューロンへと伝播します。

 ほとんどの時間、ニューロンの処理は活動閾値以下で行われており、そこでは興奮性電流と抑制性電流が絶え間なく統合されています。

 計算神経科学においては、脳が外部刺激がない場合でも状態が進化し続ける「連続的な動的システム」であることは十分に確立されています(Deco et al., 2009; Northoff, 2018)。

 脳に離散的なイベントやリセットは存在しません。

 それぞれの外部刺激は、すでに事前の構成(コンフィギュレーション)を持っている生命システムに対して作用します。

 刺激は興奮状態または抑制状態に偏りを与えるかもしれませんが、静止状態に作用することはありません。それはサッカー場のボールのようなものです。同じ軌道であっても、プレイヤーの動的な位置関係によって異なる結果を引き起こします。全く同じパスであっても、プレーが失敗することもあれば、決定的なアシストになることもあります。

 即時の刺激とは無関係にニューロンを活性化させ続けるメカニズムはよく知られています。

  • その一つは、活動電位を発生させることなく膜電位を変化させる「閾値下入力」です。
  • 他には、ニューロン間の潜在的な結合性を維持したり、局所的な活性化を促進したりする「サイレント・シナプス」や「樹状突起棘(スパイン)」が含まれます。
  • 最も重要なメカニズムは、コンテキスト(文脈)を組織化する神経伝達物質に関連した「代謝型受容体(Metabotropic receptors)」です。

 これらは活動電位がトリガーされるかどうかを直接決定するのではなく、代わりに

  • 「何が関連しており、何がそうでないか」
  • 「刺激がどのような報酬予測を運んでいるか」
  • 「警戒や危険のレベルはどの程度か」
  • 「システム内にどれほどの新奇性が存在するか」
  • 「持続的な注意がどの程度必要か」
  • 「探索と搾取のバランスはどうあるべきか」
  • 「何をエンコードし、何を忘れるべきか」
  • 「内部状態がいかに調節されるか」
  • 「衝動制御や時間的安定性がいつ有利に働くか」

 を定義します。言い換えれば、代謝型受容体は一種の賢い「メタコントロール」を実装しているのです。

 これらは「データ」ではなく、「パラメータ」です!

 これらはシステムの振る舞いを調整する動的変数として機能します。これにより、システムは即時の反応を必要とすることなく、状況の機能的な意味(新奇性、関連性、報酬、または脅威)に対して敏感になることができます。

 サッカーの比喩に戻れば、代謝型受容体はチームの「戦術」に相当します。いつ攻撃し、いつ守るか、つまり「どのようにゲームをプレイするか」を決定するのです。

 計算論的な観点から見ると、これらのメカニズムは「中間状態」を通じて機能します。それらは二進法的(活性/不活性)ではありません。システムは3つのモードで作動します:興奮(Excitatory)、抑制(Inhibitory)、そして即時の出力を生成せずに将来のダイナミクスを調整する「中間状態」です。

 生物学的な脳ネットワークにおいて「三進法(Ternary)」と言うとき、私たちは数学的な抽象概念や計算について述べているのではなく、脳がいかにして時間をかけてバランスを維持しているかという「文字通り」の機能的記述を行っているのです。

 このため、計算神経科学は主に「入力と出力のマッピング」を研究するのではなく、むしろ「状態がいかに継続的に再組織化されるか」を研究します。これらの状態は、本質的に予測的な性質を持っています(Friston, 2010; Deco et al., 2009)。

LLM(大規模言語モデル)は二進法的な計算である

 大規模言語モデルにおいて、三進法という概念は意味をなしません。学習は根本的に「誤差逆伝播(バックプロパゲーション)」に基づいています。つまり、期待されるデータに対する誤差の大きさが判明した後、最適化アルゴリズムが外部信号を用いてパラメータを調整します。

 これはどのように機能するのでしょうか? モデルは出力を生成します。

 例えば「Paris is the capital of …」に対する次の単語の予測です。もし回答が「Finland」であれば、これはトレーニングセットの正しい単語(France)と比較されます。この比較から、数値的な誤差が計算されます。この誤差は、予測が期待値からどれほど逸脱しているかを定量化します。

 次に、誤差は「勾配(Gradient)」、すなわち誤差を減らすためにモデルのパラメータをどの方向にどれだけ調整すべきかを示す数学的信号に変換されます。重みは、出力が生成され評価された後にのみ、逆方向に更新されます。

 誤差は事後(a posteriori)に計算され、重みは正しい回答が「France」になるように調整され、システムは何事もなかったかのように動作を再開します。

 大規模言語モデルでは、ダイナミクスと学習の分離が特に顕著です。推論(インファレンス)の間、パラメータは固定されたままです。オンラインの可塑性も、慣れ(habituation)も、疲労も、時間依存の適応もありません。システムは活動することによって変化することはないのです。

 サッカーの比喩で言えば、LLMは「試合後にミスを検討し、次の試合のために戦術を調整するコーチ」に似ています。しかし、試合そのものの間、チームは技術的または戦術的な修正の可能性が一切ないまま90分間を戦うのです!

 試合前の戦略と試合後の修正はありますが、プレイ中のダイナミズムは存在しません!

 したがって、LLMは機能的な意味で三進法的ではありません。それらはオフラインで訓練された「アテンション(注意)」の行列(トランスフォーマー)に過ぎません(Vaswani et al., 2017)。これは量的な制限ではなく、存在論的な違いです。

Neuraxon と Aigarth の三進法ダイナミクス

 Neuraxon(ニューラクソン)は、根本的に異なるフレームワークを導入します。

 その基本単位は、LLMのような入力・出力関数ではなく、時間とともに進化する「内部的な連続状態」です。Neuraxon において、興奮は $+1$、抑制は $-1$ として表され、これら二つの状態の間には $0$ で表される「中立範囲」が存在します。

 システムは刻一刻と、現在の入力、最近の履歴、および内部メカニズムの影響を統合し、離散的な3項出力(興奮、抑制、または中立)を生成します。

 時間と三進法の関係は中心的なものです。

 中立状態は計算の欠如や不活性を意味するのではなく、システムが即時の出力を生成せずに影響を蓄積する「閾値下フェーズ」を表します。それは、得点や失点に繋がるかどうかにかかわらず、サッカーチームが行う動的な戦術シフトに匹敵します。

 AIGarth(アイガース)は、構造レベルで同じロジックを表現しています。

 ユニット自体が三進法的であるだけでなく、ネットワークはその有用性に応じて成長、再組織化、あるいは崩壊することができ、継続的な適応を強化する「進化的次元」を導入します。

 NeuraxonAIGarth の組み合わせ(ミクロとマクロの融合)は、活性を維持し続けることができる計算組織(Intelligence Tissue Units:知性組織ユニット)を生み出します。これは、バックプロパゲーションのみに基づいたアーキテクチャでは不可能なことです。

ハードウェアの展望

 ハードウェアの問題を無視することはできません。

 現在、汎用的な三進法ハードウェアは存在しませんが、多値メモリスタや、抵抗変化型またはスピントロニクスデバイスに基づいたニューロモーフィック計算を含む、三進法ロジックのアクティブな研究ラインが存在します(Yang et al., 2013; Indiveri & Liu, 2015)。

 これらのアプローチは、消費電力を削減し、さらに重要なことに、物理的、生命的、かつ連続的なダイナミクスに合致した三進法計算を達成することを目指しています。

 専用の三進法ハードウェアがなくとも、三進法アーキテクチャには意味があるのでしょうか?

 この制限にかかわらず意味はあります。なぜなら「アーキテクチャは物理的基材に先行する」からです。

 三進法システムを設計することにより、私たちは動的な世界を反映する上での二進法ロジックの無能さを露呈させます。

 同時に、NeuraxonAIGarth のような 三進法アーキテクチャは、不要な活動を減らすことで、既存の二進法ハードウェア上であってもすでに改善をもたらすことができるのです。

参考文献


要約

 Qubic Scientific Teamが発表した「Neuraxon(ニューラクソン)」の基本思想についての要約です。従来の AI(LLM)と Qubic の知性の決定的な違いを解説します。

 参考:Google NoteBookLM によるスライドPDF

1. 脳は「スイッチ」ではなく「流れ」である

 生物の脳は、単なるON/OFFのスイッチではありません。

  • 連続的なダイナミクス:
    • 脳は外部刺激がなくても常に活動し、変化し続けています。
  • サッカーの比喩:
    • 刺激(ボール)は同じでも、チーム(脳内状態)の布陣によって結果は変わります。LLMにはこの「試合中のリアルタイムな戦術変更」がありません。
  • メタコントロール:
    • 脳内の「代謝型受容体」は、単なるデータ処理ではなく、「何が重要か」「今は警戒すべきか」といったパラメータ(戦術)を調整しています。

2. 既存AI(LLM)の限界:二進法的な事後学習

 ChatGPT などの大規模言語モデルは、機能的に「二進法的」であり、静的です。

  • 事後修正:
    • LLMは「試合が終わった後にビデオを見て反省するコーチ」です。推論(実行)中に自分自身を書き換えることはできません。
  • ダイナミズムの欠如:
    • 学習と推論が完全に分離されており、活動することによってシステムが成長(適応)することはありません。

3. Qubicの解決策:NeuraxonとAigarthの三進法

 Qubic の AI アーキテクチャは、生物学的な脳の仕組みを数学的に模倣しています。

3つの状態:

  • $+1$(興奮):
    • 出力を促す。
  • $-1$(抑制):
    • 出力を抑える。
  • $0$(中立・蓄積):
    • 最も重要。 即座に出力せず、将来のために「タメ」を作る閾値下フェーズ。

知性組織(Intelligence Tissue):

  • Neuraxon(ミクロ)と AIGarth(マクロ)が組み合わさることで、生命体のように自ら成長・崩壊・再組織化を繰り返す「知性の組織」が形成されます。

結論:なぜ、三進法なのか

  • ハードウェアを超越する:
    • 現在のPC(二進法)上でも、三進法アーキテクチャを採用することで不要な計算を減らし、効率を高めることが可能です。
  • 未来のASIC:
  • 将来的には「メモリスタ」などの次世代デバイスにより、物理レベルでこの三進法ダイナミクスを再現するハードウェアの登場が期待されます。
official-blog/260127-beyond-binary.txt · 最終更新: by d.azuma