official_blog:260113_analysis-of-benchmarking-world-model-learning

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
official_blog:260113_analysis-of-benchmarking-world-model-learning [2026/01/13 22:37] – [補足/論文要約:世界モデル学習のベンチマーク (WorldTest) Gemini による解説] d.azumaofficial_blog:260113_analysis-of-benchmarking-world-model-learning [2026/01/13 23:12] (現在) – [Neuraxon のアプローチ] d.azuma
行 74: 行 74:
 ===== Neuraxon のアプローチ ===== ===== Neuraxon のアプローチ =====
  
-Neuraxonでは、時間をシステムの状態の一部として扱います。+**[[tag/Neuraxon]]** では、時間をシステムの状態の一部として扱います。
  
   * **ダイナミクスの保持:**   * **ダイナミクスの保持:**
     * 内部変数は明示的なダイナミクスを通じて存在し、持続し、進化し、変化します。     * 内部変数は明示的なダイナミクスを通じて存在し、持続し、進化し、変化します。
     * システムは世界を「記憶」するのではなく、世界をアクティブに保ちます。     * システムは世界を「記憶」するのではなく、世界をアクティブに保ちます。
 +
   * **適応能力:**   * **適応能力:**
     * これはLLMでは実現できないこと、つまりルールの変化に応じて構造を適応させることを可能にします。     * これはLLMでは実現できないこと、つまりルールの変化に応じて構造を適応させることを可能にします。
行 106: 行 107:
  
 著者らはこの枠組みに基づき、43種類の仮想環境と129のタスクから構成されるベンチマークAutumnBenchを開発しました。実験の結果、現在の最新AIモデルは人間のパフォーマンスに及ばず、単に計算量を増やすだけでは解決できない課題があることが浮き彫りになりました。この成果は、AIがより汎用的な世界モデルを獲得するための新たな指針を提示しています。 著者らはこの枠組みに基づき、43種類の仮想環境と129のタスクから構成されるベンチマークAutumnBenchを開発しました。実験の結果、現在の最新AIモデルは人間のパフォーマンスに及ばず、単に計算量を増やすだけでは解決できない課題があることが浮き彫りになりました。この成果は、AIがより汎用的な世界モデルを獲得するための新たな指針を提示しています。
 +
 +{{:official_blog:unnamed_2_-min.png|NotebookLM よる描画}}
 ===== 1. 「世界モデル」の本質的な定義 ===== ===== 1. 「世界モデル」の本質的な定義 =====
  
official_blog/260113_analysis-of-benchmarking-world-model-learning.1768343860.txt.gz · 最終更新: by d.azuma