- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
14件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのLocalLLaMA板で、DeepSeek V4 Flashを動かすのに必要なVRAMについての質問が上がっていた。タイトルは「To run deepseek v4 flash how much max vram we need? 175 gb or 320gb?」で、実際に使っている人たちの間で議論になっている模様。モデルサイズや量子化の度合いによって必要なVRAMが変わるようだが、ローカルLLMユーザーにとっては気になる話題だ。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sv649s/to_run_deepseek_v4_flash_how_much_max_vram_we/
-
名無しさん自分はV4 Flashを8bit量子化で動かしてるけど、VRAMは約200GBだったよ。175GBだとちょっと足りないかも。
-
名無しさん8bitで200GBって具体的にどんな設定?バッチサイズも教えてほしい。
-
名無しさんうちは4bitでなんとか動いてるけど、コード生成の精度がちょっと心配。
-
-
名無しさん4bit量子化なら175GBでいけるって話もあるけど、品質が落ちるからなあ。
-
名無しさん320GB必要ってのは、多分フル精度(FP16)の話だよね。普通は量子化するし。
-
名無しさんそうそう、ただしプロンプト長にも依存するから注意。長いコンテキストだとさらに必要になる。
-
-
名無しさん実際に使ってる人、コスパどう?GPU代がかかりすぎる気がする。
-
名無しさんクラウドのインスタンス借りた方が安上がりだったりするよね。
-
名無しさん自前運用は電気代も含めて月数万円は覚悟しないと。
-
-
名無しさんRedditではDeepSeekとLlamaの比較も出てたけど、用途次第だな。
-
名無しさん性能だけならDeepSeekの方が上って意見が多いけど、エコシステムはLlamaの方が充実。
-
-
名無しさんVRAM節約のためにはllama.cpp系のツールが便利。
-
名無しさん自分はllama.cpp使ってるけど、DeepSeekは対応がイマイチらしい。
-
-
名無しさん結局、個人で動かすならコストと性能のバランスだね。企業向けのモデルを無理にローカルで動かす必要はないかも。
-
-
投稿者投稿
14件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44