DeepSeek V4をBlackwellなしで動かす方法？FP4とTPの制約について

名無しさん · 2025-10-16T08:39:12+09:00

Reddit r/LocalLLaMA から話題を拾いました。DeepSeek V4をBlackwell世代のGPUを使わずに動かすにはどうするか、FP4量子化とテンソル並列（TP）の制約について議論されています。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1sw73ry/deepseek_v4_without_blackwell_how_are_people/

このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。

16件の返信を表示中（うち親返信6件）

投稿者

投稿
- 2025年10月16日 8:39 AM #63629 返信
  
  名無しさん
  
  Reddit r/LocalLLaMA から話題を拾いました。DeepSeek V4をBlackwell世代のGPUを使わずに動かすにはどうするか、FP4量子化とテンソル並列（TP）の制約について議論されています。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1sw73ry/deepseek_v4_without_blackwell_how_are_people/
- 2025年10月16日 8:40 AM #63630 返信
  
  名無しさん
  
  FP4ってまだ実用的なのか？精度が落ちるらしいけど。
  - 2025年10月16日 8:48 AM #63632 返信
    
    名無しさん
    
    FP4は推論だけならそこそこ使えるみたい。訓練は論外だけど。
  - 2025年10月16日 9:06 AM #63636 返信
    
    名無しさん
    
    精度低下は気になるけど、とりあえず動けばいいって人も多いんじゃない？
    - 2025年10月16日 9:15 AM #63637 返信
      
      名無しさん
      
      ローカルLLMは遊び半分だからね。FP4で十分って意見もわかる。
- 2025年10月16日 8:43 AM #63631 返信
  
  名無しさん
  
  BlackwellなしだとTPがボトルネックになるよね。H100でも厳しいって話。
  - 2025年10月16日 8:55 AM #63633 返信
    
    名無しさん
    
    TPって複数GPUで分散するやつ？メモリ帯域が足りなくて困る。
    - 2025年10月16日 8:57 AM #63634 返信
      
      名無しさん
      
      そう。DeepSeek V4はパラメータ数が巨大だから、TPなしでは動かせない。
- 2025年10月16日 9:00 AM #63635 返信
  
  名無しさん
  
  Redditのスレでは、AMDのMI300X使ってる人もいたよ。でもCUDAのエコシステムがネック。
  - 2025年10月16日 9:46 AM #63644 返信
    
    名無しさん
    
    AMDのROCm、最近改善されたけどまだ不安定。CUDA一択なのが悲しい。
- 2025年10月16日 9:17 AM #63638 返信
  
  名無しさん
  
  Blackwell待ち？それとも今の世代で工夫する？自分はH200のクラスタをレンタルしてる。
  - 2025年10月16日 9:19 AM #63639 返信
    
    名無しさん
    
    クラウド高いよね。個人でやるなら量子化が現実的。
    - 2025年10月16日 9:23 AM #63640 返信
      
      名無しさん
      
      DeepSeek V4ってオープンじゃないから、量子化モデルがまだ出てないんじゃ？
      - 2025年10月16日 9:30 AM #63641 返信
        
        名無しさん
        
        いや、公式でFP4の重みが配布されてるよ。ただし変換が面倒。
- 2025年10月16日 9:41 AM #63642 返信
  
  名無しさん
  
  TPの設定次第でメモリ使用量が変わるらしい。8GPUより4GPUの方が効率いいとか。
  - 2025年10月16日 9:43 AM #63643 返信
    
    名無しさん
    
    それはモデルサイズによる。試行錯誤が必要だね。
- 2025年10月16日 9:51 AM #63645 返信
  
  名無しさん
  
  結論としては、Blackwellなしでも何とかやるしかない。H100+NVLINKでTP組むのがベターかな。
投稿者

投稿

16件の返信を表示中（うち親返信6件）

返信先: DeepSeek V4をBlackwellなしで動かす方法？FP4とTPの制約についてで#63631に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック