DeepSeek v4 FlashをSpark/RTX Pro 6000×2で動かした話

名無しさん · 2025-10-16T02:13:27+09:00

Redditのr/LocalLLaMAで、DeepSeek v4 FlashをSpark環境（RTX Pro 6000×2）で動かしたというポストがありました。スコア1、コメント0の寂しい状態ですが、ローカルLLM好きとしては気になる内容です。モデルの性能やセットアップのコツ、コスト面など、皆さんの意見を聞かせてください。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sx5tt0/inference_deepseek_v4_flash_on_spark_2_x_rtx_pro/

このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。

21件の返信を表示中（うち親返信8件）

投稿者

投稿
- 2025年10月16日 2:13 AM #63568 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek v4 FlashをSpark環境（RTX Pro 6000×2）で動かしたというポストがありました。スコア1、コメント0の寂しい状態ですが、ローカルLLM好きとしては気になる内容です。モデルの性能やセットアップのコツ、コスト面など、皆さんの意見を聞かせてください。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sx5tt0/inference_deepseek_v4_flash_on_spark_2_x_rtx_pro/
- 2025年10月16日 2:15 AM #63569 返信
  
  名無しさん
  
  RTX Pro 6000ってやっぱ高いんだろうな…一般ユーザーには手が出せない。
  - 2025年10月16日 2:29 AM #63572 返信
    
    名無しさん
    
    でもv4 Flashは結構軽量化されてるって聞くし、一般向けGPUでも動くんじゃない？
    - 2025年10月16日 2:31 AM #63573 返信
      
      名無しさん
      
      VRAMが足りるかどうかだね。RTX 4090でも24GBだから、v4 Flashならいけるかも。
- 2025年10月16日 2:18 AM #63570 返信
  
  名無しさん
  
  Sparkって何？初めて聞いた。
  - 2025年10月16日 2:22 AM #63571 返信
    
    名無しさん
    
    SparkはNVIDIAの開発用プラットフォームだよ。DGXとかの小型版みたいな。
- 2025年10月16日 2:34 AM #63574 返信
  
  名無しさん
  
  DeepSeek v4 Flash、ベンチマークはどうなの？探したけど見つけられなかった。
  - 2025年10月16日 2:40 AM #63575 返信
    
    名無しさん
    
    Redditの投稿主が何かデータ出してくれてるかと思ったけど、コメント0だからな…。
    - 2025年10月16日 2:49 AM #63576 返信
      
      名無しさん
      
      とりあえず自分で試すのが一番確実。HuggingFaceから落として動かしてみようかな。
- 2025年10月16日 2:51 AM #63577 返信
  
  名無しさん
  
  こういう業務用ハードの話題は参考になる。でもコスパ考えるとクラウドの方が安いかもね。
  - 2025年10月16日 2:53 AM #63578 返信
    
    名無しさん
    
    クラウドはデータ漏洩が怖いからローカル一択。コストは我慢。
    - 2025年10月16日 2:57 AM #63579 返信
      
      名無しさん
      
      同意。プライバシー重視ならローカルは必須。DeepSeekはオープンなのが良い。
- 2025年10月16日 3:04 AM #63580 返信
  
  名無しさん
  
  RTX Pro 6000ってエンタープライズ向けだから、一般向けのベンチと比べられないよね。
  - 2025年10月16日 3:15 AM #63581 返信
    
    名無しさん
    
    でも同じアーキテクチャだから参考にはなる。メモリ帯域が広いのが強み。
- 2025年10月16日 3:17 AM #63582 返信
  
  名無しさん
  
  DeepSeek v4 Flash、実際どのくらいの速度出るんだろ。
  - 2025年10月16日 3:20 AM #63583 返信
    
    名無しさん
    
    多分トークン生成で20t/sくらいじゃない？RTX 4090でv3が15t/sだったから。
    - 2025年10月16日 3:25 AM #63584 返信
      
      名無しさん
      
      Flash版はもっと速いはず。最適化されてるって話だし。
- 2025年10月16日 3:32 AM #63585 返信
  
  名無しさん
  
  そもそもSparkって一般販売してるの？
  - 2025年10月16日 3:35 AM #63586 返信
    
    名無しさん
    
    してないっぽい。企業向けの限定品みたい。
    - 2025年10月16日 3:38 AM #63587 返信
      
      名無しさん
      
      じゃあこのスレ、ただの自慢かよｗ
      - 2025年10月16日 3:44 AM #63588 返信
        
        名無しさん
        
        いや、情報としては価値ある。将来の参考になる。
- 2025年10月16日 3:54 AM #63589 返信
  
  名無しさん
  
  DeepSeek v4 Flash、日本語も結構いけるらしいから試してみたい。
投稿者

投稿

21件の返信を表示中（うち親返信8件）

返信先: DeepSeek v4 FlashをSpark/RTX Pro 6000×2で動かした話で#63569に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック