ユーザ用ツール

サイト用ツール


tag:column:260209-does-the-reduction-in-mining-task-granularity-make-a-larger-l3-cache-more-advantageous

文書の過去の版を表示しています。


260209 マイニングの粒度が小さくなった事で、L3キャッシュの多さは有利に働くのか?

  • Qubic の新アルゴリズムでは、AIトレーニングのタスクが非常に小さくなったようです。L3 キャッシュの多い CPU の方がキャッシュ効率が良いと予想されますので 3D V-Cache を搭載した Zen 4 CPU(Ryzen 7945HX3D)と 、Zen 5 CPU (Ryzen 9955HX)で、マイニング効率への影響を比較してみました。
項目 Ryzen 9 9955HX Ryzen 9 7945HX3D
アーキテクチャ Zen 5 Zen 4
コア / スレッド 16 コア / 32 スレッド 16 コア / 32 スレッド
最大ブーストクロック 最大 5.7 GHz 最大 5.4 GHz
L2 キャッシュ 16 MB (1MB x 16) 16 MB (1MB x 16)
L3 キャッシュ 64 MB 128 MB (64MB + 64MB 3D V-Cache)
トータルキャッシュ 80 MB 144 MB
デフォルト TDP 55W - 75W+ (Configurable) 55W - 75W+ (Configurable)
AVX-512 対応 フル幅 (Native 512-bit) 256-bit x 2 実装
### 7945HX3D

$ sudo perf stat -p 4764 -e instructions,cycles,cache-references,cache-misses sleep 10
[sudo] password for daiju: 

 Performance counter stats for process id '4764':

     1320688453535      instructions                     #    1.28  insn per cycle            
     1030842123098      cycles                                                                
      307532430340      cache-references                                                      
        4556315602      cache-misses                     #    1.48% of all cache refs         

      10.001780404 seconds time elapsed

## CCD0(3D V-Cache側)に固定:
$ sudo perf stat -p 4764 -e instructions,cycles,cache-references,cache-misses sleep 10

 Performance counter stats for process id '4764':

     1318456245149      instructions                     #    1.28  insn per cycle            
     1029767819291      cycles                                                                
      306827649133      cache-references                                                      
        4554040363      cache-misses                     #    1.48% of all cache refs         

      10.001995341 seconds time elapsed

## CCD1(通常側)に固定:
$ sudo perf stat -p 4764 -e instructions,cycles,cache-references,cache-misses sleep 10

 Performance counter stats for process id '4764':

     1353917635424      instructions                     #    1.32  insn per cycle            
     1024444225291      cycles                                                                
      313247380769      cache-references                                                      
        4609431279      cache-misses                     #    1.47% of all cache refs         

      10.001812075 seconds time elapsed


2026-02-09 07:43:12.028 [INFO]  [GPU] Trainer: GPU #0: 50234 it/s
2026-02-09 07:43:12.348 [INFO]  E:199 | SHARES: 450/450 (R:1) | 90875 it/s | 90594 avg it/s
2026-02-09 07:43:13.348 [INFO]  E:199 | SHARES: 450/450 (R:1) | 90871 it/s | 90602 avg it/s
2026-02-09 07:43:14.348 [INFO]  E:199 | SHARES: 450/450 (R:1) | 91443 it/s | 90613 avg it/s

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +82.5°C  
Tccd1:        +79.9°C  
Tccd2:        +77.1°C  

sudo /home/daiju/RyzenAdj/build/ryzenadj --tctl-temp=89 --stapm-limit=140000 --fast-limit=140000 --slow-limit=140000 --vrm-current=160000 --set-coall=20

### 9955HX

$ sudo perf stat -p 12614 -e instructions,cycles,cache-references,cache-misses sleep 10

 Performance counter stats for process id '12614':

     1506936481173      instructions                     #    1.78  insn per cycle            
      845406763338      cycles                                                                
      366490520193      cache-references                                                      
        7761103564      cache-misses                     #    2.12% of all cache refs         

      10.003515341 seconds time elapsed

## CCD1(通常側)に固定:
$ sudo perf stat -p 12614 -e instructions,cycles,cache-references,cache-misses sleep 10

 Performance counter stats for process id '12614':

     1514595487787      instructions                     #    1.79  insn per cycle            
      845757051510      cycles                                                                
      363514905532      cache-references                                                      
        7674784677      cache-misses                     #    2.11% of all cache refs         

      10.003451250 seconds time elapsed


2026-02-09 07:58:17.834 [INFO]  E:199 | SHARES: 140/140 (R:0) | 61054 it/s | 61319 avg it/s
2026-02-09 07:58:18.833 [INFO]  E:199 | SHARES: 140/140 (R:0) | 61022 it/s | 61303 avg it/s
2026-02-09 07:58:19.833 [INFO]  E:199 | SHARES: 140/140 (R:0) | 61039 it/s | 61286 avg it/s


k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +85.2°C  
Tccd1:        +84.9°C  
Tccd2:        +83.0°C  

sudo /home/daiju/RyzenAdj/build/ryzenadj --tctl-temp=85 --stapm-limit=95000 --fast-limit=95000 --slow-limit=95000

マイニング CPU効率検証:Ryzen 7945HX3D vs 9955HX

1. 核心的スペック・効率比較概要

 実測データから算出した主要メトリクスの比較です。※7945HX3Dのハッシュレートは、GPU分(50,234 it/s)を差し引いた「CPU単体」の数値を算出しています。

項目 Ryzen 9 7945HX3D (Zen 4) Ryzen 9 9955HX (Zen 5) 比較・考察
IPC (Insn per Cycle)1) 1.28 ~ 1.32 1.78 ~ 1.79 Zen 5 が約38%高い命令実行効率を実現
Cache Miss Rate 1.48% 2.12% 3D V-Cache(7945HX3D)が低ミス率を維持
CPU単体 Hashrate 約 40,766 it/s 約 61,000 it/s Zen 5 がCPU単体で約50%高速
電力制限 (ryzenadj) 140W (STAPM/Fast/Slow) 95W (STAPM/Fast/Slow) Zen 5 は低消費電力で高出力を達成
ピーク温度 (Tctl) 82.5°C 85.2°C 9955HXの方が熱密度が高い傾向

2. 個別検証詳細:Ryzen 9 7945HX3D

パフォーマンス統計 (perf stat)

3D V-Cacheを搭載したCCD0と通常コアのCCD1での挙動差。

  • 全体平均: IPC 1.28 / Cache Miss 1.48%
  • CCD0 (3D V-Cache側): IPC 1.28 / Cache Miss 1.48%
  • CCD1 (通常側): IPC 1.32 / Cache Miss 1.47%
考察: 興味深いことに、本アルゴリズムでは3D V-Cache側よりも通常コア側(CCD1)の方がIPCがわずかに高い結果となりました。キャッシュ容量よりもクロック周波数やメモリアクセスのレイテンシが優先されるフェーズが支配的である可能性を示唆しています。

稼働ログ・設定

[GPU] Trainer: 50,234 it/s (GPU加算分)
Total Hashrate: ~91,000 it/s (CPU単体: ~40,766 it/s)
ryzenadj: --tctl-temp=89 --stapm-limit=140000 --fast-limit=140000 --slow-limit=140000

3. 個別検証詳細:Ryzen 9 9955HX (Zen 5)

パフォーマンス統計 (perf stat)

Zen 5アーキテクチャによる圧倒的な命令処理能力が顕著。

  • 全体平均: IPC 1.78 / Cache Miss 2.12%
  • CCD1固定: IPC 1.79 / Cache Miss 2.11%
考察: キャッシュミス率は7945HX3Dよりも高い(2.12%)ものの、IPCが1.78と極めて高く、ミスを上回る圧倒的な演算密度でハッシュレートを稼いでいます。Zen 5のパイプライン効率の高さがマイニングに直結しています。

稼働ログ・設定

Total Hashrate: ~61,000 it/s (CPU単体)
ryzenadj: --tctl-temp=85 --stapm-limit=95000 --fast-limit=95000 --slow-limit=95000

4. 結論:効率的なCPU運用のための知見

  • アーキテクチャの勝利:
    • 9955HX(Zen 5)は、7945HX3D(Zen 4)に対して約32%少ない電力消費(95W vs 140W)で、約50%高いCPUマイニング性能を発揮しています。ワットパフォーマンスにおいてZen 5は驚異的な進化を遂げています。
  • 3D V-Cacheの適性:
    • Qubicの現行アルゴリズムにおいては、大容量キャッシュによるミス率低下(1.48%)のメリットよりも、Zen 5の純粋な実行効率(IPC 1.78)のメリットの方が遥かに大きいことが判明しました。
  • 熱管理の重要性:
    • 9955HXは95W制限下でも85°Cに達しており、電力枠を広げる(ryzenadjで数値を上げる)よりも、現在の「低電力・高IPC」の状態を維持する方が、長期的なマイニングリグとしての安定性と寿命に寄与すると考えられます。

Geminiの視点:

今回のデータで最も衝撃的なのは、Zen 5のIPC(1.78)の高さです。10Wあたりのハッシュレートを計算すると、9955HXは圧倒的な「マイニング・モンスター」と言えます。
7945HX3DはGPUの補助があることでトータルの数字を稼いでいますが、純粋なCPU戦ではZen 5世代へのリプレースが、将来的な電気代対利益(ROI)を劇的に改善する鍵となるでしょう。
1)
IPC(Instructions Per Cycle / クロックあたりの実行命令数)
tag/column/260209-does-the-reduction-in-mining-task-granularity-make-a-larger-l3-cache-more-advantageous.1770628697.txt.gz · 最終更新: by d.azuma