- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
27件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、DeepSeek-R1をローカルで動かすのに必要なVRAM容量を実際に計算した人がいたので話題になってた。モデルサイズだけでなくKVキャッシュのメモリ使用量も考慮した試算で、結構衝撃的な数字が出てたみたい。
-
名無しさんDeepSeek-R1って確か671BパラメータのMoEだったよな?普通のGPUじゃ無理だろ
-
名無しさんマジで?それでも量子化すればなんとかなるって話も聞くけど
-
名無しさん4bit量子化でもVRAM400GB超えって試算だったぞ。個人じゃ無理ゲー
-
-
-
名無しさんKVキャッシュ込みでってところが重要だな。推論時はキャッシュがメモリ食うから
-
名無しさん確かに。コンテキスト長が長くなるとさらに必要になるからね
-
-
名無しさんでもクラウドなら使えるし、API経由で十分じゃね?
-
名無しさんAPIも高いし、プライバシー気にするならローカルが理想だけどな
-
名無しさんDeepSeekのAPIは結構安いって評判だけど、R1は知らん
-
-
名無しさんちょっと待て、MoEって全部のパラメータアクティブになるわけじゃないから、実効パラメータはもっと少ないんじゃなかった?
-
名無しさんそれでも数十GBは必要だろ。今のコンシューマGPUじゃ厳しい
-
名無しさんアクティブパラメータだけなら37Bとか言われてる。それでもVRAMは結構いるけど
-
-
名無しさんローカルLLM界隈もここまで来たか。昔は7Bがやっとだったのに
-
名無しさん進化は早いけど、ハードウェアが追いついてないな
-
名無しさんでもR1の性能はSOTAクラスらしいから、クラウドで使う価値はある
-
-
名無しさんこの手の計算、モデルによって前提が違うから一概に比較できんよな
-
名無しさんそうそう。量子化の精度やキャッシュの管理方法で変わるし
-
名無しさんRedditの投稿では具体的な数字出てたけど、実際はもっと最適化できるかもな
-
-
名無しさんDeepSeekって中国製だからデータ扱いに注意って意見もよく見る
-
名無しさんローカルならその辺はクリアできるからな。結局個人運用は難しいけど
-
-
名無しさんR1のベンチマークすごいね。OpenAIのo1に匹敵するって
-
名無しさんしかもオープンなのがでかい。研究に使える
-
名無しさんでもAPI使うならo1でよくね?って気もする
-
-
名無しさんVRAMの計算自体、勉強になったわ。自分でも小さなモデルで試してみよう
-
名無しさん同じく。KVキャッシュの考慮を忘れがちだから参考になる
-
-
名無しさん結局、マルチGPU構成にするか諦めるかだな
-
名無しさんApple Siliconの統一メモリも限界あるしなあ
-
名無しさん待て、R1の蒸留版なら小さくてもそこそこ使えるって話もあるぞ
-
-
-
投稿者投稿
27件の返信を表示中(うち親返信10件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34