DeepSeek-R1のVRAM必要量を計算してみた（KVキャッシュ込み）

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。

27件の返信を表示中（うち親返信10件）

投稿者

投稿
- 2025年11月10日 9:09 PM #67459 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek-R1をローカルで動かすのに必要なVRAM容量を実際に計算した人がいたので話題になってた。モデルサイズだけでなくKVキャッシュのメモリ使用量も考慮した試算で、結構衝撃的な数字が出てたみたい。
- 2025年11月10日 9:10 PM #67460 返信
  
  名無しさん
  
  DeepSeek-R1って確か671BパラメータのMoEだったよな？普通のGPUじゃ無理だろ
  - 2025年11月10日 9:13 PM #67461 返信
    
    名無しさん
    
    マジで？それでも量子化すればなんとかなるって話も聞くけど
    - 2025年11月10日 9:18 PM #67462 返信
      
      名無しさん
      
      4bit量子化でもVRAM400GB超えって試算だったぞ。個人じゃ無理ゲー
- 2025年11月10日 9:25 PM #67463 返信
  
  名無しさん
  
  KVキャッシュ込みでってところが重要だな。推論時はキャッシュがメモリ食うから
  - 2025年11月10日 9:27 PM #67464 返信
    
    名無しさん
    
    確かに。コンテキスト長が長くなるとさらに必要になるからね
- 2025年11月10日 9:30 PM #67465 返信
  
  名無しさん
  
  でもクラウドなら使えるし、API経由で十分じゃね？
  - 2025年11月10日 9:36 PM #67466 返信
    
    名無しさん
    
    APIも高いし、プライバシー気にするならローカルが理想だけどな
  - 2025年11月10日 9:45 PM #67467 返信
    
    名無しさん
    
    DeepSeekのAPIは結構安いって評判だけど、R1は知らん
- 2025年11月10日 9:46 PM #67468 返信
  
  名無しさん
  
  ちょっと待て、MoEって全部のパラメータアクティブになるわけじゃないから、実効パラメータはもっと少ないんじゃなかった？
  - 2025年11月10日 9:49 PM #67469 返信
    
    名無しさん
    
    それでも数十GBは必要だろ。今のコンシューマGPUじゃ厳しい
  - 2025年11月10日 9:53 PM #67470 返信
    
    名無しさん
    
    アクティブパラメータだけなら37Bとか言われてる。それでもVRAMは結構いるけど
- 2025年11月10日 9:59 PM #67471 返信
  
  名無しさん
  
  ローカルLLM界隈もここまで来たか。昔は7Bがやっとだったのに
  - 2025年11月10日 10:11 PM #67472 返信
    
    名無しさん
    
    進化は早いけど、ハードウェアが追いついてないな
  - 2025年11月10日 10:13 PM #67473 返信
    
    名無しさん
    
    でもR1の性能はSOTAクラスらしいから、クラウドで使う価値はある
- 2025年11月10日 10:16 PM #67474 返信
  
  名無しさん
  
  この手の計算、モデルによって前提が違うから一概に比較できんよな
  - 2025年11月10日 10:20 PM #67475 返信
    
    名無しさん
    
    そうそう。量子化の精度やキャッシュの管理方法で変わるし
  - 2025年11月10日 10:28 PM #67476 返信
    
    名無しさん
    
    Redditの投稿では具体的な数字出てたけど、実際はもっと最適化できるかもな
- 2025年11月10日 10:30 PM #67477 返信
  
  名無しさん
  
  DeepSeekって中国製だからデータ扱いに注意って意見もよく見る
  - 2025年11月10日 10:34 PM #67478 返信
    
    名無しさん
    
    ローカルならその辺はクリアできるからな。結局個人運用は難しいけど
- 2025年11月10日 10:39 PM #67479 返信
  
  名無しさん
  
  R1のベンチマークすごいね。OpenAIのo1に匹敵するって
  - 2025年11月10日 10:49 PM #67480 返信
    
    名無しさん
    
    しかもオープンなのがでかい。研究に使える
  - 2025年11月10日 10:51 PM #67481 返信
    
    名無しさん
    
    でもAPI使うならo1でよくね？って気もする
- 2025年11月10日 10:54 PM #67482 返信
  
  名無しさん
  
  VRAMの計算自体、勉強になったわ。自分でも小さなモデルで試してみよう
  - 2025年11月10日 10:58 PM #67483 返信
    
    名無しさん
    
    同じく。KVキャッシュの考慮を忘れがちだから参考になる
- 2025年11月10日 11:05 PM #67484 返信
  
  名無しさん
  
  結局、マルチGPU構成にするか諦めるかだな
  - 2025年11月10日 11:17 PM #67485 返信
    
    名無しさん
    
    Apple Siliconの統一メモリも限界あるしなあ
  - 2025年11月10日 11:18 PM #67486 返信
    
    名無しさん
    
    待て、R1の蒸留版なら小さくてもそこそこ使えるって話もあるぞ
投稿者

投稿

27件の返信を表示中（うち親返信10件）

返信先: DeepSeek-R1のVRAM必要量を計算してみた（KVキャッシュ込み）で#67461に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック