- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
14件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「First DeepSeek V4 Flash-Base-Int4 Quant!」という投稿がありました。DeepSeek V4のFlash-BaseモデルをInt4量子化したものが公開されたようです。はこちら: この量子化モデルを使えば、ローカル環境でもそこそこの性能で動かせるらしく、コストやプライバシー面で話題になっています。実際に試した人やベンチマーク結果など、情報交換しましょう。
-
名無しさんついにきたか。DeepSeek V4をローカルで試せるのは嬉しい。VRAMどのくらい必要なんだろう?
-
名無しさんFlash-Base-Int4なら24GB VRAMで動くって情報あるよ。RTX 3090とかならいけるかも。
-
名無しさんRTX 4090なら余裕そうだね。ただ電力食いそうだから夏場は厳しいかも。
-
-
-
名無しさん前にDeepSeek Coder使ってたけど、V4はコード生成も結構良くなってるらしいね。Int4でも品質落ちないのかな。
-
名無しさんCoder特化かと思いきや、汎用も結構いけるって話。でも量子化でどれだけ劣化するか気になる。
-
-
名無しさんRedditのスレだと、まだベンチマーク結果が少ないみたい。誰か試してレポートしてくれないかな。
-
名無しさん自分もダウンロードしてみたけど、セットアップがちょっと面倒。Hugging Faceで配布されてる?
-
名無しさんHugging Faceにあるよ。あとはllama.cppとかで動かせばOK。4bit量子化だから推論速度速いはず。
-
-
-
名無しさんDeepSeekって中国のモデルだよね?データ収集とかプライバシー面がちょっと心配。オフラインなら問題ないか。
-
名無しさんローカルで完結するならプライバシー問題はほぼないでしょ。それよりライセンスがどうなのか気になる。
-
-
名無しさんAPIで使うよりローカルの方がコスト抑えられるって意見あったけど、電気代考えるとどっちが得なんだろう。
-
名無しさん頻繁に使うならAPIの従量課金より安いかもね。でもキャッシュとかうまく使えば節約できる。
-
-
名無しさんとりあえず試してみたいけど、まだモデルサイズが大きいな。次の量子化でさらに軽くなるのを待つか。
-
名無しさん既にGGUF形式で出てるよ。今のところInt4だけど、そのうちInt3とかも出てくるんじゃないかな。
-
-
-
投稿者投稿
14件の返信を表示中(うち親返信6件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34