DeepSeek V4-flashのファインチューニング、2枚のRTX Pro 6000で可能か？

名無しさん · 2025-10-02T18:28:05+09:00

Reddit r/LocalLLaMAで「Can I finetune Deepseek V4-flash with two rtx pro 6000s」というスレが立っていました。DeepSeek V4-flashのファインチューニングに2枚のRTX Pro 6000（合計96GB VRAM）で十分かどうかの議論です。モデルサイズや量子化、LoRAの使用などが話題に上がっていました。参考URL: https://www.reddit.com/r/LocalLLaMA/comments/1u1sbn3/can_i_finetune_deepseek_v4flash_with_two_rtx_pro/

このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。

22件の返信を表示中（うち親返信11件）

投稿者

投稿
- 2025年10月2日 6:28 PM #61511 返信
  
  名無しさん
  
  Reddit r/LocalLLaMAで「Can I finetune Deepseek V4-flash with two rtx pro 6000s」というスレが立っていました。DeepSeek V4-flashのファインチューニングに2枚のRTX Pro 6000（合計96GB VRAM）で十分かどうかの議論です。モデルサイズや量子化、LoRAの使用などが話題に上がっていました。参考URL: https://www.reddit.com/r/LocalLLaMA/comments/1u1sbn3/can_i_finetune_deepseek_v4flash_with_two_rtx_pro/
- 2025年10月2日 6:29 PM #61512 返信
  
  名無しさん
  
  96GBあれば余裕じゃない？ LoRAなら8bit量子化モデルで行けると思う。
  - 2025年10月2日 6:44 PM #61515 返信
    
    名無しさん
    
    2枚でNVLink接続できるなら尚更いいね。ただしメモリ帯域も重要。
- 2025年10月2日 6:32 PM #61513 返信
  
  名無しさん
  
  DeepSeek V4-flashってパラメータ数どれくらいなんだ？調べてみたら数百Bとか？
  - 2025年10月2日 6:37 PM #61514 返信
    
    名無しさん
    
    確か671Bだったかな。フルファインチューニングは無理でもQLoRAなら可能だと思う。
- 2025年10月2日 6:46 PM #61516 返信
  
  名無しさん
  
  実際に試した人いる？自分は4090 24GB一枚でV4-flashの推論すらきつい。
  - 2025年10月2日 6:49 PM #61517 返信
    
    名無しさん
    
    4090で推論は量子化すれば何とか。でもファインチューニングは無理ゲー。
- 2025年10月2日 6:55 PM #61518 返信
  
  名無しさん
  
  RTX Pro 6000ってメモリ多いけどコア数はゲーミングカードより少ないんだよね。学習速度どうなんだろう。
  - 2025年10月2日 7:04 PM #61519 返信
    
    名無しさん
    
    FP32だと遅いけど、混合精度ならゲーミングカードと大差ないって聞いた。
- 2025年10月2日 7:05 PM #61520 返信
  
  名無しさん
  
  個人的にはH100とかの方が安定してると思うけど、予算次第だな。
  - 2025年10月2日 7:08 PM #61521 返信
    
    名無しさん
    
    H100は高すぎるわ。個人で買えるレベルじゃない。
- 2025年10月2日 7:12 PM #61522 返信
  
  名無しさん
  
  クラウドでレンタルした方がコスパ良くね？電気代や冷却考えたら。
  - 2025年10月2日 7:18 PM #61523 返信
    
    名無しさん
    
    でも長期で使うなら買い切りの方が安い場合もある。運用次第。
- 2025年10月2日 7:30 PM #61524 返信
  
  名無しさん
  
  DeepSeek V4って昨年話題になったけど、今はもう古いんじゃない？
  - 2025年10月2日 7:32 PM #61525 返信
    
    名無しさん
    
    いや、V4-flashは新しいバージョンだよ。アーキテクチャも改良されてる。
- 2025年10月2日 7:35 PM #61526 返信
  
  名無しさん
  
  ファインチューニングするならデータセット準備が大変そう。
  - 2025年10月2日 7:39 PM #61527 返信
    
    名無しさん
    
    ちゃんとクレンジングしないとむしろ性能落ちるから注意な。
- 2025年10月2日 7:47 PM #61528 返信
  
  名無しさん
  
  2枚刺しだとPCIeレーン数も気になるな。x8 x8でも問題ないか？
  - 2025年10月2日 7:49 PM #61529 返信
    
    名無しさん
    
    学習ならレーン数よりメモリ帯域の方が重要。x8でもほぼ影響ないってベンチあった。
- 2025年10月2日 7:53 PM #61530 返信
  
  名無しさん
  
  Redditのコメントでは、LoRAで試せってアドバイスが多かったな。
  - 2025年10月2日 7:58 PM #61531 返信
    
    名無しさん
    
    LoRAなら8bit量子化で48GBでもいけるらしい。96GBならかなり柔軟。
- 2025年10月2日 8:08 PM #61532 返信
  
  名無しさん
  
  とりあえず試してみたいけど、ライセンス的に商用利用は大丈夫なの？
  - 2025年10月2日 8:10 PM #61533 返信
    
    名無しさん
    
    DeepSeekはMITライセンスだから商用OKだったはず。ただし派生モデルの規約要確認。
投稿者

投稿

22件の返信を表示中（うち親返信11件）

返信先: DeepSeek V4-flashのファインチューニング、2枚のRTX Pro 6000で可能か？で#61532に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック