- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
27件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、DeepSeek-R1をローカルで動かすのに必要なVRAM容量を実際に計算した人がいたので話題になってた。モデルサイズだけでなくKVキャッシュのメモリ使用量も考慮した試算で、結構衝撃的な数字が出てたみたい。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1rtdgd0/finally_did_the_math_on_deepseekr1_vram/
-
名無しさんDeepSeek-R1って確か671BパラメータのMoEだったよな?普通のGPUじゃ無理だろ
-
名無しさんマジで?それでも量子化すればなんとかなるって話も聞くけど
-
名無しさん4bit量子化でもVRAM400GB超えって試算だったぞ。個人じゃ無理ゲー
-
-
-
名無しさんKVキャッシュ込みでってところが重要だな。推論時はキャッシュがメモリ食うから
-
名無しさん確かに。コンテキスト長が長くなるとさらに必要になるからね
-
-
名無しさんでもクラウドなら使えるし、API経由で十分じゃね?
-
名無しさんAPIも高いし、プライバシー気にするならローカルが理想だけどな
-
名無しさんDeepSeekのAPIは結構安いって評判だけど、R1は知らん
-
-
名無しさんちょっと待て、MoEって全部のパラメータアクティブになるわけじゃないから、実効パラメータはもっと少ないんじゃなかった?
-
名無しさんそれでも数十GBは必要だろ。今のコンシューマGPUじゃ厳しい
-
名無しさんアクティブパラメータだけなら37Bとか言われてる。それでもVRAMは結構いるけど
-
-
名無しさんローカルLLM界隈もここまで来たか。昔は7Bがやっとだったのに
-
名無しさん進化は早いけど、ハードウェアが追いついてないな
-
名無しさんでもR1の性能はSOTAクラスらしいから、クラウドで使う価値はある
-
-
名無しさんこの手の計算、モデルによって前提が違うから一概に比較できんよな
-
名無しさんそうそう。量子化の精度やキャッシュの管理方法で変わるし
-
名無しさんRedditの投稿では具体的な数字出てたけど、実際はもっと最適化できるかもな
-
-
名無しさんDeepSeekって中国製だからデータ扱いに注意って意見もよく見る
-
名無しさんローカルならその辺はクリアできるからな。結局個人運用は難しいけど
-
-
名無しさんR1のベンチマークすごいね。OpenAIのo1に匹敵するって
-
名無しさんしかもオープンなのがでかい。研究に使える
-
名無しさんでもAPI使うならo1でよくね?って気もする
-
-
名無しさんVRAMの計算自体、勉強になったわ。自分でも小さなモデルで試してみよう
-
名無しさん同じく。KVキャッシュの考慮を忘れがちだから参考になる
-
-
名無しさん結局、マルチGPU構成にするか諦めるかだな
-
名無しさんApple Siliconの統一メモリも限界あるしなあ
-
名無しさん待て、R1の蒸留版なら小さくてもそこそこ使えるって話もあるぞ
-
-
-
投稿者投稿
27件の返信を表示中(うち親返信10件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44