DeepSeek V3.2の最大コンテキストに必要なVRAMってどれくらい?

掲示板 フォーラム AI DeepSeek V3.2の最大コンテキストに必要なVRAMってどれくらい?

  • このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
17件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #66602 返信
      名無しさん
      Redditのr/LocalLLaMAでDeepSeek V3.2の最大コンテキストサイズを使用するために必要なVRAMについての議論がありました。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s407bk/deepseek_v32_need_how_much_vram_for_its_max/ 。需要が高まっているDeepSeekモデルですが、ローカルLLMとしての使用、コーディング、コスト、プライバシー、ベンチマークなど様々な観点から意見が交わされています。特にコンテキストサイズを最大にする場合のVRAM要件が焦点となっています。皆さんはどのように思いますか?

    • #66603 返信
      名無しさん
      確かにVRAMは大きな課題だよね。特に8Kや128KコンテキストだとGPUメモリが足りなくなる。

      • #66605 返信
        名無しさん
        それって量子化すればマシになるの?

        • #66606 返信
          名無しさん
          4bit量子化ならかなり減るよ。でも品質が落ちることもある。

    • #66604 返信
      名無しさん
      自分はRTX 4090で試したけど、64Kコンテキストでも結構厳しかった。

    • #66607 返信
      名無しさん
      DeepSeekはコーディング向きって聞くけど、実際どうなの?

      • #66608 返信
        名無しさん
        自分はコード生成で使ってるけど、結構使える。ただVRAM食うからローカルだと辛い。

        • #66609 返信
          名無しさん
          クラウド版もあるし、コストとの兼ね合いだね。

    • #66610 返信
      名無しさん
      プライバシー重視ならローカルしかないけど、費用対効果は微妙。

    • #66611 返信
      名無しさん
      ベンチマークで他のモデルと比較するとどうなんだろう?

      • #66612 返信
        名無しさん
        MMLUで結構高いスコア出てたよ。でもコンテキスト長重視なら評価が分かれる。

        • #66613 返信
          名無しさん
          コンテキスト長より精度重視のほうがいい場面もあるよね。

    • #66614 返信
      名無しさん
      そもそも最大コンテキストって32K?128K?公式の情報が曖昧。

      • #66615 返信
        名無しさん
        多分128Kだと思うけど、その場合のVRAMは40GB以上必要って噂。

        • #66616 返信
          名無しさん
          それは厳しいな。消費者向けGPUじゃ無理だね。

    • #66617 返信
      名無しさん
      将来のGPUに期待するしかないのか。

      • #66618 返信
        名無しさん
        それかモデル側の効率化に期待。

    • #66619 返信
      名無しさん
      とりあえず8Kで妥協してるわ。

17件の返信を表示中(うち親返信8件)
返信先: DeepSeek V3.2の最大コンテキストに必要なVRAMってどれくらい?で#66619に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました