DeepSeek-R1のVRAM必要量を計算してみた（KVキャッシュ込み）

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより11ヶ月前に更新されました。

27件の返信を表示中（うち親返信10件）

投稿者

投稿
- 2025年7月26日 9:31 AM #67459 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek-R1をローカルで動かすのに必要なVRAM容量を実際に計算した人がいたので話題になってた。モデルサイズだけでなくKVキャッシュのメモリ使用量も考慮した試算で、結構衝撃的な数字が出てたみたい。
- 2025年7月26日 9:33 AM #67460 返信
  
  名無しさん
  
  DeepSeek-R1って確か671BパラメータのMoEだったよな？普通のGPUじゃ無理だろ
  - 2025年7月26日 9:36 AM #67461 返信
    
    名無しさん
    
    マジで？それでも量子化すればなんとかなるって話も聞くけど
    - 2025年7月26日 9:40 AM #67462 返信
      
      名無しさん
      
      4bit量子化でもVRAM400GB超えって試算だったぞ。個人じゃ無理ゲー
- 2025年7月26日 9:47 AM #67463 返信
  
  名無しさん
  
  KVキャッシュ込みでってところが重要だな。推論時はキャッシュがメモリ食うから
  - 2025年7月26日 9:49 AM #67464 返信
    
    名無しさん
    
    確かに。コンテキスト長が長くなるとさらに必要になるからね
- 2025年7月26日 9:52 AM #67465 返信
  
  名無しさん
  
  でもクラウドなら使えるし、API経由で十分じゃね？
  - 2025年7月26日 9:58 AM #67466 返信
    
    名無しさん
    
    APIも高いし、プライバシー気にするならローカルが理想だけどな
  - 2025年7月26日 10:07 AM #67467 返信
    
    名無しさん
    
    DeepSeekのAPIは結構安いって評判だけど、R1は知らん
- 2025年7月26日 10:09 AM #67468 返信
  
  名無しさん
  
  ちょっと待て、MoEって全部のパラメータアクティブになるわけじゃないから、実効パラメータはもっと少ないんじゃなかった？
  - 2025年7月26日 10:11 AM #67469 返信
    
    名無しさん
    
    それでも数十GBは必要だろ。今のコンシューマGPUじゃ厳しい
  - 2025年7月26日 10:15 AM #67470 返信
    
    名無しさん
    
    アクティブパラメータだけなら37Bとか言われてる。それでもVRAMは結構いるけど
- 2025年7月26日 10:22 AM #67471 返信
  
  名無しさん
  
  ローカルLLM界隈もここまで来たか。昔は7Bがやっとだったのに
  - 2025年7月26日 10:33 AM #67472 返信
    
    名無しさん
    
    進化は早いけど、ハードウェアが追いついてないな
  - 2025年7月26日 10:35 AM #67473 返信
    
    名無しさん
    
    でもR1の性能はSOTAクラスらしいから、クラウドで使う価値はある
- 2025年7月26日 10:38 AM #67474 返信
  
  名無しさん
  
  この手の計算、モデルによって前提が違うから一概に比較できんよな
  - 2025年7月26日 10:43 AM #67475 返信
    
    名無しさん
    
    そうそう。量子化の精度やキャッシュの管理方法で変わるし
  - 2025年7月26日 10:50 AM #67476 返信
    
    名無しさん
    
    Redditの投稿では具体的な数字出てたけど、実際はもっと最適化できるかもな
- 2025年7月26日 10:53 AM #67477 返信
  
  名無しさん
  
  DeepSeekって中国製だからデータ扱いに注意って意見もよく見る
  - 2025年7月26日 10:56 AM #67478 返信
    
    名無しさん
    
    ローカルならその辺はクリアできるからな。結局個人運用は難しいけど
- 2025年7月26日 11:02 AM #67479 返信
  
  名無しさん
  
  R1のベンチマークすごいね。OpenAIのo1に匹敵するって
  - 2025年7月26日 11:12 AM #67480 返信
    
    名無しさん
    
    しかもオープンなのがでかい。研究に使える
  - 2025年7月26日 11:13 AM #67481 返信
    
    名無しさん
    
    でもAPI使うならo1でよくね？って気もする
- 2025年7月26日 11:16 AM #67482 返信
  
  名無しさん
  
  VRAMの計算自体、勉強になったわ。自分でも小さなモデルで試してみよう
  - 2025年7月26日 11:20 AM #67483 返信
    
    名無しさん
    
    同じく。KVキャッシュの考慮を忘れがちだから参考になる
- 2025年7月26日 11:27 AM #67484 返信
  
  名無しさん
  
  結局、マルチGPU構成にするか諦めるかだな
  - 2025年7月26日 11:39 AM #67485 返信
    
    名無しさん
    
    Apple Siliconの統一メモリも限界あるしなあ
  - 2025年7月26日 11:41 AM #67486 返信
    
    名無しさん
    
    待て、R1の蒸留版なら小さくてもそこそこ使えるって話もあるぞ
投稿者

投稿

27件の返信を表示中（うち親返信10件）

返信先: DeepSeek-R1のVRAM必要量を計算してみた（KVキャッシュ込み）で#67471に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック