- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
22件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAで「Can I finetune Deepseek V4-flash with two rtx pro 6000s」というスレが立っていました。DeepSeek V4-flashのファインチューニングに2枚のRTX Pro 6000(合計96GB VRAM)で十分かどうかの議論です。モデルサイズや量子化、LoRAの使用などが話題に上がっていました。参考URL: https://www.reddit.com/r/LocalLLaMA/comments/1u1sbn3/can_i_finetune_deepseek_v4flash_with_two_rtx_pro/
-
名無しさん96GBあれば余裕じゃない? LoRAなら8bit量子化モデルで行けると思う。
-
名無しさん2枚でNVLink接続できるなら尚更いいね。ただしメモリ帯域も重要。
-
-
名無しさんDeepSeek V4-flashってパラメータ数どれくらいなんだ? 調べてみたら数百Bとか?
-
名無しさん確か671Bだったかな。フルファインチューニングは無理でもQLoRAなら可能だと思う。
-
-
名無しさん実際に試した人いる? 自分は4090 24GB一枚でV4-flashの推論すらきつい。
-
名無しさん4090で推論は量子化すれば何とか。でもファインチューニングは無理ゲー。
-
-
名無しさんRTX Pro 6000ってメモリ多いけどコア数はゲーミングカードより少ないんだよね。学習速度どうなんだろう。
-
名無しさんFP32だと遅いけど、混合精度ならゲーミングカードと大差ないって聞いた。
-
-
名無しさん個人的にはH100とかの方が安定してると思うけど、予算次第だな。
-
名無しさんH100は高すぎるわ。個人で買えるレベルじゃない。
-
-
名無しさんクラウドでレンタルした方がコスパ良くね? 電気代や冷却考えたら。
-
名無しさんでも長期で使うなら買い切りの方が安い場合もある。運用次第。
-
-
名無しさんDeepSeek V4って昨年話題になったけど、今はもう古いんじゃない?
-
名無しさんいや、V4-flashは新しいバージョンだよ。アーキテクチャも改良されてる。
-
-
名無しさんファインチューニングするならデータセット準備が大変そう。
-
名無しさんちゃんとクレンジングしないとむしろ性能落ちるから注意な。
-
-
名無しさん2枚刺しだとPCIeレーン数も気になるな。x8 x8でも問題ないか?
-
名無しさん学習ならレーン数よりメモリ帯域の方が重要。x8でもほぼ影響ないってベンチあった。
-
-
名無しさんRedditのコメントでは、LoRAで試せってアドバイスが多かったな。
-
名無しさんLoRAなら8bit量子化で48GBでもいけるらしい。96GBならかなり柔軟。
-
-
名無しさんとりあえず試してみたいけど、ライセンス的に商用利用は大丈夫なの?
-
名無しさんDeepSeekはMITライセンスだから商用OKだったはず。ただし派生モデルの規約要確認。
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44