tag:column:260209-does-the-reduction-in-mining-task-granularity-make-a-larger-l3-cache-more-advantageous

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
tag:column:260209-does-the-reduction-in-mining-task-granularity-make-a-larger-l3-cache-more-advantageous [2026/02/09 09:07] – 削除 - 外部編集 (不明な日付) 127.0.0.1tag:column:260209-does-the-reduction-in-mining-task-granularity-make-a-larger-l3-cache-more-advantageous [2026/02/09 09:40] (現在) d.azuma
行 1: 行 1:
 +====== 260209 マイニングの粒度が小さくなった事で L3キャッシュの多さは有利に働くのか? ======
 +
 +  * Qubic の新アルゴリズムでは、AIトレーニングのタスクが非常に小さくなったようです。L3 キャッシュの多い CPU の方がキャッシュ効率が良いと予想されますので 3D V-Cache を搭載した Zen 4 CPU(Ryzen 7945HX3D)と 、Zen 5 CPU (Ryzen 9955HX)で、マイニング効率への影響を比較してみました。
 +
 +^ 項目 ^ Ryzen 9 9955HX ^ Ryzen 9 7945HX3D ^
 +| **アーキテクチャ** | **Zen 5** | Zen 4 |
 +| **コア / スレッド** | 16 コア / 32 スレッド | 16 コア / 32 スレッド |
 +| **最大ブーストクロック** | **最大 5.7 GHz** | 最大 5.4 GHz |
 +| **L2 キャッシュ** | 16 MB (1MB x 16) | 16 MB (1MB x 16) |
 +| **L3 キャッシュ** | 64 MB | **128 MB (64MB + 64MB 3D V-Cache)** |
 +| **トータルキャッシュ** | 80 MB | **144 MB** |
 +| **デフォルト TDP** | 55W - 75W+ (Configurable) | 55W - 75W+ (Configurable) |
 +| **AVX-512 対応** | **フル幅 (Native 512-bit)** | 256-bit x 2 実装 |
 +
 +|  [[https://drive.google.com/file/d/1JPYQq9lx_c8kXh4m7baS8Xl7mW71ieP5/view?usp=drive_link|Google NotebookLM スライドPDF]]\\ {{.:pasted:20260209-090146.png?800}}  |
 +
 +
 +
 +<code>
 +### 7945HX3D
 +
 +$ sudo perf stat -p 4764 -e instructions,cycles,cache-references,cache-misses sleep 10
 +[sudo] password for daiju: 
 +
 + Performance counter stats for process id '4764':
 +
 +     1320688453535      instructions                     #    1.28  insn per cycle            
 +     1030842123098      cycles                                                                
 +      307532430340      cache-references                                                      
 +        4556315602      cache-misses                     #    1.48% of all cache refs         
 +
 +      10.001780404 seconds time elapsed
 +
 +## CCD0(3D V-Cache側)に固定:
 +$ sudo perf stat -p 4764 -e instructions,cycles,cache-references,cache-misses sleep 10
 +
 + Performance counter stats for process id '4764':
 +
 +     1318456245149      instructions                     #    1.28  insn per cycle            
 +     1029767819291      cycles                                                                
 +      306827649133      cache-references                                                      
 +        4554040363      cache-misses                     #    1.48% of all cache refs         
 +
 +      10.001995341 seconds time elapsed
 +
 +## CCD1(通常側)に固定:
 +$ sudo perf stat -p 4764 -e instructions,cycles,cache-references,cache-misses sleep 10
 +
 + Performance counter stats for process id '4764':
 +
 +     1353917635424      instructions                     #    1.32  insn per cycle            
 +     1024444225291      cycles                                                                
 +      313247380769      cache-references                                                      
 +        4609431279      cache-misses                     #    1.47% of all cache refs         
 +
 +      10.001812075 seconds time elapsed
 +
 +
 +2026-02-09 07:43:12.028 [INFO]  [GPU] Trainer: GPU #0: 50234 it/s
 +2026-02-09 07:43:12.348 [INFO]  E:199 | SHARES: 450/450 (R:1) | 90875 it/s | 90594 avg it/s
 +2026-02-09 07:43:13.348 [INFO]  E:199 | SHARES: 450/450 (R:1) | 90871 it/s | 90602 avg it/s
 +2026-02-09 07:43:14.348 [INFO]  E:199 | SHARES: 450/450 (R:1) | 91443 it/s | 90613 avg it/s
 +
 +k10temp-pci-00c3
 +Adapter: PCI adapter
 +Tctl:         +82.5°C  
 +Tccd1:        +79.9°C  
 +Tccd2:        +77.1°C  
 +
 +sudo /home/daiju/RyzenAdj/build/ryzenadj --tctl-temp=89 --stapm-limit=140000 --fast-limit=140000 --slow-limit=140000 --vrm-current=160000 --set-coall=20
 +
 +
 +</code>
 +
 +<code>
 +### 9955HX
 +
 +$ sudo perf stat -p 12614 -e instructions,cycles,cache-references,cache-misses sleep 10
 +
 + Performance counter stats for process id '12614':
 +
 +     1506936481173      instructions                     #    1.78  insn per cycle            
 +      845406763338      cycles                                                                
 +      366490520193      cache-references                                                      
 +        7761103564      cache-misses                     #    2.12% of all cache refs         
 +
 +      10.003515341 seconds time elapsed
 +
 +## CCD1(通常側)に固定:
 +$ sudo perf stat -p 12614 -e instructions,cycles,cache-references,cache-misses sleep 10
 +
 + Performance counter stats for process id '12614':
 +
 +     1514595487787      instructions                     #    1.79  insn per cycle            
 +      845757051510      cycles                                                                
 +      363514905532      cache-references                                                      
 +        7674784677      cache-misses                     #    2.11% of all cache refs         
 +
 +      10.003451250 seconds time elapsed
 +
 +
 +2026-02-09 07:58:17.834 [INFO]  E:199 | SHARES: 140/140 (R:0) | 61054 it/s | 61319 avg it/s
 +2026-02-09 07:58:18.833 [INFO]  E:199 | SHARES: 140/140 (R:0) | 61022 it/s | 61303 avg it/s
 +2026-02-09 07:58:19.833 [INFO]  E:199 | SHARES: 140/140 (R:0) | 61039 it/s | 61286 avg it/s
 +
 +
 +k10temp-pci-00c3
 +Adapter: PCI adapter
 +Tctl:         +85.2°C  
 +Tccd1:        +84.9°C  
 +Tccd2:        +83.0°C  
 +
 +sudo /home/daiju/RyzenAdj/build/ryzenadj --tctl-temp=85 --stapm-limit=95000 --fast-limit=95000 --slow-limit=95000
 +
 +
 +</code>
 +
 +
 +===== マイニング CPU効率検証:Ryzen 7945HX3D vs 9955HX =====
 +
 +
 +===== 1. 核心的スペック・効率比較概要 =====
 +
 + 実測データから算出した主要メトリクスの比較です。※7945HX3Dのハッシュレートは、GPU分(50,234 it/s)を差し引いた「CPU単体」の数値を算出しています。
 +
 +^ 項目 ^ Ryzen 9 7945HX3D (Zen 4) ^ Ryzen 9 9955HX (Zen 5) ^ 比較・考察 ^
 +| **IPC (Insn per Cycle)**((IPC(Instructions Per Cycle / クロックあたりの実行命令数))) | **1.28 ~ 1.32** | **1.78 ~ 1.79** | Zen 5 が約38%高い命令実行効率を実現 |
 +| **Cache Miss Rate** | **1.48%** | **2.12%** | 3D V-Cache(7945HX3D)が低ミス率を維持 |
 +| **CPU単体 Hashrate** | **約 40,766 it/s** | **約 61,000 it/s** | Zen 5 がCPU単体で約50%高速 |
 +| **電力制限 (ryzenadj)** | 140W (STAPM/Fast/Slow) | **95W** (STAPM/Fast/Slow) | Zen 5 は低消費電力で高出力を達成 |
 +| **ピーク温度 (Tctl)** | 82.5°C | 85.2°C | 9955HXの方が熱密度が高い傾向 |
 +
 +===== 2. 個別検証詳細:Ryzen 9 7945HX3D =====
 +
 +==== パフォーマンス統計 (perf stat) ====
 +3D V-Cacheを搭載したCCD0と通常コアのCCD1での挙動差。
 +
 +  * **全体平均:** IPC 1.28 / Cache Miss 1.48%
 +  * **CCD0 (3D V-Cache側):** IPC 1.28 / Cache Miss 1.48%
 +  * **CCD1 (通常側):** **IPC 1.32** / Cache Miss 1.47%
 +
 +> **考察:** 興味深いことに、本アルゴリズムでは3D V-Cache側よりも通常コア側(CCD1)の方がIPCがわずかに高い結果となりました。キャッシュ容量よりもクロック周波数やメモリアクセスのレイテンシが優先されるフェーズが支配的である可能性を示唆しています。
 +
 +==== 稼働ログ・設定 ====
 +<code>
 +[GPU] Trainer: 50,234 it/s (GPU加算分)
 +Total Hashrate: ~91,000 it/s (CPU単体: ~40,766 it/s)
 +ryzenadj: --tctl-temp=89 --stapm-limit=140000 --fast-limit=140000 --slow-limit=140000
 +</code>
 +
 +===== 3. 個別検証詳細:Ryzen 9 9955HX (Zen 5) =====
 +
 +==== パフォーマンス統計 (perf stat) ====
 +Zen 5アーキテクチャによる圧倒的な命令処理能力が顕著。
 +
 +  * **全体平均:** **IPC 1.78** / Cache Miss 2.12%
 +  * **CCD1固定:** IPC 1.79 / Cache Miss 2.11%
 +
 +> **考察:** キャッシュミス率は7945HX3Dよりも高い(2.12%)ものの、IPCが1.78と極めて高く、ミスを上回る圧倒的な演算密度でハッシュレートを稼いでいます。Zen 5のパイプライン効率の高さがマイニングに直結しています。
 +
 +==== 稼働ログ・設定 ====
 +<code>
 +Total Hashrate: ~61,000 it/s (CPU単体)
 +ryzenadj: --tctl-temp=85 --stapm-limit=95000 --fast-limit=95000 --slow-limit=95000
 +</code>
 +
 +===== 4. 結論:効率的なCPU運用のための知見 =====
 +
 +  * **アーキテクチャの勝利:** 
 +    * 9955HX(Zen 5)は、7945HX3D(Zen 4)に対して**約32%少ない電力消費(95W vs 140W)で、約50%高いCPUマイニング性能**を発揮しています。ワットパフォーマンスにおいてZen 5は驚異的な進化を遂げています。
 +
 +  * **3D V-Cacheの適性:** 
 +    * Qubicの現行アルゴリズムにおいては、大容量キャッシュによるミス率低下(1.48%)のメリットよりも、Zen 5の純粋な実行効率(IPC 1.78)のメリットの方が遥かに大きいことが判明しました。
 +
 +  * **熱管理の重要性:** 
 +    * 9955HXは95W制限下でも85°Cに達しており、電力枠を広げる(ryzenadjで数値を上げる)よりも、現在の「低電力・高IPC」の状態を維持する方が、長期的なマイニングリグとしての安定性と寿命に寄与すると考えられます。
 +
 +----
 +**Geminiの視点:**
 +> 今回のデータで最も衝撃的なのは、Zen 5のIPC(1.78)の高さです。10Wあたりのハッシュレートを計算すると、9955HXは圧倒的な「マイニング・モンスター」と言えます。
 +> 7945HX3DはGPUの補助があることでトータルの数字を稼いでいますが、純粋なCPU戦ではZen 5世代へのリプレースが、将来的な電気代対利益(ROI)を劇的に改善する鍵となるでしょう。
 +
 +===== Related Articles =====
 +
 +{{topic> }}
 +
 +{{tag>マイニング 検証 column }}
 +