DeepSeek V4 FlashのVRAM要件:175GBか320GBか?

掲示板 フォーラム AI DeepSeek V4 FlashのVRAM要件:175GBか320GBか?

  • このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
14件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #64711 返信
      名無しさん
      RedditのLocalLLaMA板で、DeepSeek V4 Flashを動かすのに必要なVRAMについての質問が上がっていた。タイトルは「To run deepseek v4 flash how much max vram we need? 175 gb or 320gb?」で、実際に使っている人たちの間で議論になっている模様。モデルサイズや量子化の度合いによって必要なVRAMが変わるようだが、ローカルLLMユーザーにとっては気になる話題だ。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sv649s/to_run_deepseek_v4_flash_how_much_max_vram_we/

    • #64712 返信
      名無しさん
      自分はV4 Flashを8bit量子化で動かしてるけど、VRAMは約200GBだったよ。175GBだとちょっと足りないかも。

      • #64714 返信
        名無しさん
        8bitで200GBって具体的にどんな設定?バッチサイズも教えてほしい。

      • #64715 返信
        名無しさん
        うちは4bitでなんとか動いてるけど、コード生成の精度がちょっと心配。

    • #64713 返信
      名無しさん
      4bit量子化なら175GBでいけるって話もあるけど、品質が落ちるからなあ。

    • #64716 返信
      名無しさん
      320GB必要ってのは、多分フル精度(FP16)の話だよね。普通は量子化するし。

      • #64717 返信
        名無しさん
        そうそう、ただしプロンプト長にも依存するから注意。長いコンテキストだとさらに必要になる。

    • #64718 返信
      名無しさん
      実際に使ってる人、コスパどう?GPU代がかかりすぎる気がする。

      • #64719 返信
        名無しさん
        クラウドのインスタンス借りた方が安上がりだったりするよね。

      • #64720 返信
        名無しさん
        自前運用は電気代も含めて月数万円は覚悟しないと。

    • #64721 返信
      名無しさん
      RedditではDeepSeekとLlamaの比較も出てたけど、用途次第だな。

      • #64722 返信
        名無しさん
        性能だけならDeepSeekの方が上って意見が多いけど、エコシステムはLlamaの方が充実。

    • #64723 返信
      名無しさん
      VRAM節約のためにはllama.cpp系のツールが便利。

      • #64724 返信
        名無しさん
        自分はllama.cpp使ってるけど、DeepSeekは対応がイマイチらしい。

    • #64725 返信
      名無しさん
      結局、個人で動かすならコストと性能のバランスだね。企業向けのモデルを無理にローカルで動かす必要はないかも。

14件の返信を表示中(うち親返信7件)
返信先: DeepSeek V4 FlashのVRAM要件:175GBか320GBか?で#64720に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました