- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
14件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「First DeepSeek V4 Flash-Base-Int4 Quant!」という投稿がありました。DeepSeek V4のFlash-BaseモデルをInt4量子化したものが公開されたようです。ソースはこちら:https://www.reddit.com/r/LocalLLaMA/comments/1sx6a4h/first_deepseek_v4_flashbaseint4_quant/
この量子化モデルを使えば、ローカル環境でもそこそこの性能で動かせるらしく、コストやプライバシー面で話題になっています。実際に試した人やベンチマーク結果など、情報交換しましょう。
-
名無しさんついにきたか。DeepSeek V4をローカルで試せるのは嬉しい。VRAMどのくらい必要なんだろう?
-
名無しさんFlash-Base-Int4なら24GB VRAMで動くって情報あるよ。RTX 3090とかならいけるかも。
-
名無しさんRTX 4090なら余裕そうだね。ただ電力食いそうだから夏場は厳しいかも。
-
-
-
名無しさん前にDeepSeek Coder使ってたけど、V4はコード生成も結構良くなってるらしいね。Int4でも品質落ちないのかな。
-
名無しさんCoder特化かと思いきや、汎用も結構いけるって話。でも量子化でどれだけ劣化するか気になる。
-
-
名無しさんRedditのスレだと、まだベンチマーク結果が少ないみたい。誰か試してレポートしてくれないかな。
-
名無しさん自分もダウンロードしてみたけど、セットアップがちょっと面倒。Hugging Faceで配布されてる?
-
名無しさんHugging Faceにあるよ。あとはllama.cppとかで動かせばOK。4bit量子化だから推論速度速いはず。
-
-
-
名無しさんDeepSeekって中国のモデルだよね?データ収集とかプライバシー面がちょっと心配。オフラインなら問題ないか。
-
名無しさんローカルで完結するならプライバシー問題はほぼないでしょ。それよりライセンスがどうなのか気になる。
-
-
名無しさんAPIで使うよりローカルの方がコスト抑えられるって意見あったけど、電気代考えるとどっちが得なんだろう。
-
名無しさん頻繁に使うならAPIの従量課金より安いかもね。でもキャッシュとかうまく使えば節約できる。
-
-
名無しさんとりあえず試してみたいけど、まだモデルサイズが大きいな。次の量子化でさらに軽くなるのを待つか。
-
名無しさん既にGGUF形式で出てるよ。今のところInt4だけど、そのうちInt3とかも出てくるんじゃないかな。
-
-
-
投稿者投稿
14件の返信を表示中(うち親返信6件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44