DeepSeek V3.2の最大コンテキストに必要なVRAMってどれくらい？

このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。

17件の返信を表示中（うち親返信8件）

投稿者

投稿
- 2025年11月5日 7:49 AM #66602 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAでDeepSeek V3.2の最大コンテキストサイズを使用するために必要なVRAMについての議論がありました。:。需要が高まっているDeepSeekモデルですが、ローカルLLMとしての使用、コーディング、コスト、プライバシー、ベンチマークなど様々な観点から意見が交わされています。特にコンテキストサイズを最大にする場合のVRAM要件が焦点となっています。皆さんはどのように思いますか？
- 2025年11月5日 7:50 AM #66603 返信
  
  名無しさん
  
  確かにVRAMは大きな課題だよね。特に8Kや128KコンテキストだとGPUメモリが足りなくなる。
  - 2025年11月5日 7:57 AM #66605 返信
    
    名無しさん
    
    それって量子化すればマシになるの？
    - 2025年11月5日 8:04 AM #66606 返信
      
      名無しさん
      
      4bit量子化ならかなり減るよ。でも品質が落ちることもある。
- 2025年11月5日 7:53 AM #66604 返信
  
  名無しさん
  
  自分はRTX 4090で試したけど、64Kコンテキストでも結構厳しかった。
- 2025年11月5日 8:06 AM #66607 返信
  
  名無しさん
  
  DeepSeekはコーディング向きって聞くけど、実際どうなの？
  - 2025年11月5日 8:10 AM #66608 返信
    
    名無しさん
    
    自分はコード生成で使ってるけど、結構使える。ただVRAM食うからローカルだと辛い。
    - 2025年11月5日 8:16 AM #66609 返信
      
      名無しさん
      
      クラウド版もあるし、コストとの兼ね合いだね。
- 2025年11月5日 8:25 AM #66610 返信
  
  名無しさん
  
  プライバシー重視ならローカルしかないけど、費用対効果は微妙。
- 2025年11月5日 8:26 AM #66611 返信
  
  名無しさん
  
  ベンチマークで他のモデルと比較するとどうなんだろう？
  - 2025年11月5日 8:29 AM #66612 返信
    
    名無しさん
    
    MMLUで結構高いスコア出てたよ。でもコンテキスト長重視なら評価が分かれる。
    - 2025年11月5日 8:33 AM #66613 返信
      
      名無しさん
      
      コンテキスト長より精度重視のほうがいい場面もあるよね。
- 2025年11月5日 8:39 AM #66614 返信
  
  名無しさん
  
  そもそも最大コンテキストって32K？128K？公式の情報が曖昧。
  - 2025年11月5日 8:51 AM #66615 返信
    
    名無しさん
    
    多分128Kだと思うけど、その場合のVRAMは40GB以上必要って噂。
    - 2025年11月5日 8:53 AM #66616 返信
      
      名無しさん
      
      それは厳しいな。消費者向けGPUじゃ無理だね。
- 2025年11月5日 8:56 AM #66617 返信
  
  名無しさん
  
  将来のGPUに期待するしかないのか。
  - 2025年11月5日 9:00 AM #66618 返信
    
    名無しさん
    
    それかモデル側の効率化に期待。
- 2025年11月5日 9:08 AM #66619 返信
  
  名無しさん
  
  とりあえず8Kで妥協してるわ。
投稿者

投稿

17件の返信を表示中（うち親返信8件）

返信先: DeepSeek V3.2の最大コンテキストに必要なVRAMってどれくらい？で#66603に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック