- このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
17件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek V3.2の最大コンテキストサイズを使用するために必要なVRAMについての議論がありました。:。需要が高まっているDeepSeekモデルですが、ローカルLLMとしての使用、コーディング、コスト、プライバシー、ベンチマークなど様々な観点から意見が交わされています。特にコンテキストサイズを最大にする場合のVRAM要件が焦点となっています。皆さんはどのように思いますか?
-
名無しさん確かにVRAMは大きな課題だよね。特に8Kや128KコンテキストだとGPUメモリが足りなくなる。
-
名無しさんそれって量子化すればマシになるの?
-
名無しさん4bit量子化ならかなり減るよ。でも品質が落ちることもある。
-
-
-
名無しさん自分はRTX 4090で試したけど、64Kコンテキストでも結構厳しかった。
-
名無しさんDeepSeekはコーディング向きって聞くけど、実際どうなの?
-
名無しさん自分はコード生成で使ってるけど、結構使える。ただVRAM食うからローカルだと辛い。
-
名無しさんクラウド版もあるし、コストとの兼ね合いだね。
-
-
-
名無しさんプライバシー重視ならローカルしかないけど、費用対効果は微妙。
-
名無しさんベンチマークで他のモデルと比較するとどうなんだろう?
-
名無しさんMMLUで結構高いスコア出てたよ。でもコンテキスト長重視なら評価が分かれる。
-
名無しさんコンテキスト長より精度重視のほうがいい場面もあるよね。
-
-
-
名無しさんそもそも最大コンテキストって32K?128K?公式の情報が曖昧。
-
名無しさん多分128Kだと思うけど、その場合のVRAMは40GB以上必要って噂。
-
名無しさんそれは厳しいな。消費者向けGPUじゃ無理だね。
-
-
-
名無しさん将来のGPUに期待するしかないのか。
-
名無しさんそれかモデル側の効率化に期待。
-
-
名無しさんとりあえず8Kで妥協してるわ。
-
-
投稿者投稿
17件の返信を表示中(うち親返信8件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34