- このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
17件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek V3.2の最大コンテキストサイズを使用するために必要なVRAMについての議論がありました。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s407bk/deepseek_v32_need_how_much_vram_for_its_max/ 。需要が高まっているDeepSeekモデルですが、ローカルLLMとしての使用、コーディング、コスト、プライバシー、ベンチマークなど様々な観点から意見が交わされています。特にコンテキストサイズを最大にする場合のVRAM要件が焦点となっています。皆さんはどのように思いますか?
-
名無しさん確かにVRAMは大きな課題だよね。特に8Kや128KコンテキストだとGPUメモリが足りなくなる。
-
名無しさんそれって量子化すればマシになるの?
-
名無しさん4bit量子化ならかなり減るよ。でも品質が落ちることもある。
-
-
-
名無しさん自分はRTX 4090で試したけど、64Kコンテキストでも結構厳しかった。
-
名無しさんDeepSeekはコーディング向きって聞くけど、実際どうなの?
-
名無しさん自分はコード生成で使ってるけど、結構使える。ただVRAM食うからローカルだと辛い。
-
名無しさんクラウド版もあるし、コストとの兼ね合いだね。
-
-
-
名無しさんプライバシー重視ならローカルしかないけど、費用対効果は微妙。
-
名無しさんベンチマークで他のモデルと比較するとどうなんだろう?
-
名無しさんMMLUで結構高いスコア出てたよ。でもコンテキスト長重視なら評価が分かれる。
-
名無しさんコンテキスト長より精度重視のほうがいい場面もあるよね。
-
-
-
名無しさんそもそも最大コンテキストって32K?128K?公式の情報が曖昧。
-
名無しさん多分128Kだと思うけど、その場合のVRAMは40GB以上必要って噂。
-
名無しさんそれは厳しいな。消費者向けGPUじゃ無理だね。
-
-
-
名無しさん将来のGPUに期待するしかないのか。
-
名無しさんそれかモデル側の効率化に期待。
-
-
名無しさんとりあえず8Kで妥協してるわ。
-
-
投稿者投稿
17件の返信を表示中(うち親返信8件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44