Dual DGX SparksでDeepSeek V4 Flashのベンチ: 1Mコンテキストで40tks、合計350tks、RTX Pro 6000...

名無しさん · 2025-10-01T22:33:00+09:00

Reddit r/LocalLLaMAで投稿されたDeepSeek V4 Flashのベンチマークの話題です。Dual DGX Sparks構成で1Mコンテキスト時に40tk/s、集約で350tk/sだったそうです。比較対象としてRTX Pro 6000やMac M2 Ultra（192GB）も載ってました。ローカルLLM環境の性能差が気になるスレッドですね。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1u5g9pr/dual_dgx_sparks_40tks_single_1m_350_tks_agg/

このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。

26件の返信を表示中（うち親返信14件）

投稿者

投稿
- 2025年10月1日 10:33 PM #61339 返信
  
  名無しさん
  
  Reddit r/LocalLLaMAで投稿されたDeepSeek V4 Flashのベンチマークの話題です。Dual DGX Sparks構成で1Mコンテキスト時に40tk/s、集約で350tk/sだったそうです。比較対象としてRTX Pro 6000やMac M2 Ultra（192GB）も載ってました。ローカルLLM環境の性能差が気になるスレッドですね。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1u5g9pr/dual_dgx_sparks_40tks_single_1m_350_tks_agg/
- 2025年10月1日 10:34 PM #61340 返信
  
  名無しさん
  
  DGX Sparksってやっぱすごいな。でも値段がなあ…
  - 2025年10月1日 10:41 PM #61342 返信
    
    名無しさん
    
    値段は気にしたら負け。個人で買うものじゃないし
- 2025年10月1日 10:37 PM #61341 返信
  
  名無しさん
  
  1Mコンテキストで40tk/sは実用的？コード補完とかには十分かも
- 2025年10月1日 10:48 PM #61343 返信
  
  名無しさん
  
  Mac M2 Ultra 192GBがこれにどこまで迫れるのか気になる
  - 2025年10月1日 10:50 PM #61344 返信
    
    名無しさん
    
    M2 Ultraだとメモリ帯域がネックじゃない？
- 2025年10月1日 10:54 PM #61345 返信
  
  名無しさん
  
  DeepSeek V4 Flashって量子化モデルだよね？FP8とか？
  - 2025年10月1日 11:00 PM #61346 返信
    
    名無しさん
    
    たぶんFP8量子化。RTX Pro 6000でも似たような速度出るらしい
- 2025年10月1日 11:09 PM #61347 返信
  
  名無しさん
  
  350tk/sの集約って、どうやって計測したんだろう？
  - 2025年10月1日 11:10 PM #61348 返信
    
    名無しさん
    
    恐らくtensor並列とパイプライン並列の合計値
- 2025年10月1日 11:13 PM #61349 返信
  
  名無しさん
  
  こういうベンチを見ると、自前でクラスタ組むのはコスパ悪いな
  - 2025年10月1日 11:17 PM #61350 返信
    
    名無しさん
    
    でもレンタルよりは長期的に安い場合もある
- 2025年10月1日 11:23 PM #61351 返信
  
  名無しさん
  
  1Mコンテキストって実際どのくらい使うんだろう
  - 2025年10月1日 11:35 PM #61352 返信
    
    名無しさん
    
    コードベース全体とか長文解析には便利
- 2025年10月1日 11:37 PM #61353 返信
  
  名無しさん
  
  このスピードならリアルタイム翻訳にも使えそう
  - 2025年10月1日 11:40 PM #61354 返信
    
    名無しさん
    
    でも遅延は別問題だよね
- 2025年10月1日 11:44 PM #61355 返信
  
  名無しさん
  
  RTX Pro 6000ってゲーミングカードより高いのに性能どうなの？
  - 2025年10月1日 11:52 PM #61356 返信
    
    名無しさん
    
    メモリ増えてるけど、DGX Sparksには敵わないみたい
- 2025年10月1日 11:54 PM #61357 返信
  
  名無しさん
  
  こういう比較見ると、Apple Siliconの統合メモリは便利だけど速度で負ける
  - 2025年10月1日 11:58 PM #61358 返信
    
    名無しさん
    
    でも手軽さではMacが上。セットアップ簡単
- 2025年10月2日 12:03 AM #61359 返信
  
  名無しさん
  
  DGX Sparksの消費電力はどれくらい？
  - 2025年10月2日 12:13 AM #61360 返信
    
    名無しさん
    
    多分2000W超え。冷却も大変そう
- 2025年10月2日 12:15 AM #61361 返信
  
  名無しさん
  
  個人的にはAMDのMI300Xも気になる
  - 2025年10月2日 12:18 AM #61362 返信
    
    名無しさん
    
    ROCmの互換性がネックだと思う
- 2025年10月2日 12:22 AM #61363 返信
  
  名無しさん
  
  このベンチマーク、モデルのバージョンはDeepSeek V4 Flashで固定？
  - 2025年10月2日 12:29 AM #61364 返信
    
    名無しさん
    
    たぶん量子化の度合いも同じはず
- 2025年10月2日 12:41 AM #61365 返信
  
  名無しさん
  
  次はConsumer GPUでの比較も見てみたい
投稿者

投稿

26件の返信を表示中（うち親返信14件）

返信先: Dual DGX SparksでDeepSeek V4 Flashのベンチ: 1Mコンテキストで40tks、合計350tks、RTX Pro 6000…

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック