DeepSeek V4-flashのファインチューニング、2枚のRTX Pro 6000で可能か?

掲示板 フォーラム AI DeepSeek V4-flashのファインチューニング、2枚のRTX Pro 6000で可能か?

  • このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
22件の返信を表示中(うち親返信11件)
  • 投稿者
    投稿
    • #61511 返信
      名無しさん
      Reddit r/LocalLLaMAで「Can I finetune Deepseek V4-flash with two rtx pro 6000s」というスレが立っていました。DeepSeek V4-flashのファインチューニングに2枚のRTX Pro 6000(合計96GB VRAM)で十分かどうかの議論です。モデルサイズや量子化、LoRAの使用などが話題に上がっていました。参考URL: https://www.reddit.com/r/LocalLLaMA/comments/1u1sbn3/can_i_finetune_deepseek_v4flash_with_two_rtx_pro/

    • #61512 返信
      名無しさん
      96GBあれば余裕じゃない? LoRAなら8bit量子化モデルで行けると思う。

      • #61515 返信
        名無しさん
        2枚でNVLink接続できるなら尚更いいね。ただしメモリ帯域も重要。

    • #61513 返信
      名無しさん
      DeepSeek V4-flashってパラメータ数どれくらいなんだ? 調べてみたら数百Bとか?

      • #61514 返信
        名無しさん
        確か671Bだったかな。フルファインチューニングは無理でもQLoRAなら可能だと思う。

    • #61516 返信
      名無しさん
      実際に試した人いる? 自分は4090 24GB一枚でV4-flashの推論すらきつい。

      • #61517 返信
        名無しさん
        4090で推論は量子化すれば何とか。でもファインチューニングは無理ゲー。

    • #61518 返信
      名無しさん
      RTX Pro 6000ってメモリ多いけどコア数はゲーミングカードより少ないんだよね。学習速度どうなんだろう。

      • #61519 返信
        名無しさん
        FP32だと遅いけど、混合精度ならゲーミングカードと大差ないって聞いた。

    • #61520 返信
      名無しさん
      個人的にはH100とかの方が安定してると思うけど、予算次第だな。

      • #61521 返信
        名無しさん
        H100は高すぎるわ。個人で買えるレベルじゃない。

    • #61522 返信
      名無しさん
      クラウドでレンタルした方がコスパ良くね? 電気代や冷却考えたら。

      • #61523 返信
        名無しさん
        でも長期で使うなら買い切りの方が安い場合もある。運用次第。

    • #61524 返信
      名無しさん
      DeepSeek V4って昨年話題になったけど、今はもう古いんじゃない?

      • #61525 返信
        名無しさん
        いや、V4-flashは新しいバージョンだよ。アーキテクチャも改良されてる。

    • #61526 返信
      名無しさん
      ファインチューニングするならデータセット準備が大変そう。

      • #61527 返信
        名無しさん
        ちゃんとクレンジングしないとむしろ性能落ちるから注意な。

    • #61528 返信
      名無しさん
      2枚刺しだとPCIeレーン数も気になるな。x8 x8でも問題ないか?

      • #61529 返信
        名無しさん
        学習ならレーン数よりメモリ帯域の方が重要。x8でもほぼ影響ないってベンチあった。

    • #61530 返信
      名無しさん
      Redditのコメントでは、LoRAで試せってアドバイスが多かったな。

      • #61531 返信
        名無しさん
        LoRAなら8bit量子化で48GBでもいけるらしい。96GBならかなり柔軟。

    • #61532 返信
      名無しさん
      とりあえず試してみたいけど、ライセンス的に商用利用は大丈夫なの?

      • #61533 返信
        名無しさん
        DeepSeekはMITライセンスだから商用OKだったはず。ただし派生モデルの規約要確認。

22件の返信を表示中(うち親返信11件)
返信先: DeepSeek V4-flashのファインチューニング、2枚のRTX Pro 6000で可能か?で#61527に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました