DeepSeek V4 Flash-Base-Int4量子化モデル、ローカルで動かしてみた

名無しさん · 2025-03-04T05:20:48+09:00

Redditのr/LocalLLaMAで「First DeepSeek V4 Flash-Base-Int4 Quant!」という投稿がありました。DeepSeek V4のFlash-BaseモデルをInt4量子化したものが公開されたようです。はこちら：この量子化モデルを使えば、ローカル環境でもそこそこの性能で動かせるらしく、コストやプライバシー面で話題になっています。実際に試した人やベンチマーク結果など、情報交換しましょう。

このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。

14件の返信を表示中（うち親返信6件）

投稿者

投稿
- 2025年3月4日 5:20 AM #64167 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで「First DeepSeek V4 Flash-Base-Int4 Quant!」という投稿がありました。DeepSeek V4のFlash-BaseモデルをInt4量子化したものが公開されたようです。はこちら：この量子化モデルを使えば、ローカル環境でもそこそこの性能で動かせるらしく、コストやプライバシー面で話題になっています。実際に試した人やベンチマーク結果など、情報交換しましょう。
- 2025年3月4日 5:22 AM #64168 返信
  
  名無しさん
  
  ついにきたか。DeepSeek V4をローカルで試せるのは嬉しい。VRAMどのくらい必要なんだろう？
  - 2025年3月4日 5:29 AM #64170 返信
    
    名無しさん
    
    Flash-Base-Int4なら24GB VRAMで動くって情報あるよ。RTX 3090とかならいけるかも。
    - 2025年3月4日 5:42 AM #64173 返信
      
      名無しさん
      
      RTX 4090なら余裕そうだね。ただ電力食いそうだから夏場は厳しいかも。
- 2025年3月4日 5:25 AM #64169 返信
  
  名無しさん
  
  前にDeepSeek Coder使ってたけど、V4はコード生成も結構良くなってるらしいね。Int4でも品質落ちないのかな。
  - 2025年3月4日 5:38 AM #64172 返信
    
    名無しさん
    
    Coder特化かと思いきや、汎用も結構いけるって話。でも量子化でどれだけ劣化するか気になる。
- 2025年3月4日 5:36 AM #64171 返信
  
  名無しさん
  
  Redditのスレだと、まだベンチマーク結果が少ないみたい。誰か試してレポートしてくれないかな。
  - 2025年3月4日 5:58 AM #64176 返信
    
    名無しさん
    
    自分もダウンロードしてみたけど、セットアップがちょっと面倒。Hugging Faceで配布されてる？
    - 2025年3月4日 6:01 AM #64177 返信
      
      名無しさん
      
      Hugging Faceにあるよ。あとはllama.cppとかで動かせばOK。4bit量子化だから推論速度速いはず。
- 2025年3月4日 5:48 AM #64174 返信
  
  名無しさん
  
  DeepSeekって中国のモデルだよね？データ収集とかプライバシー面がちょっと心配。オフラインなら問題ないか。
  - 2025年3月4日 5:57 AM #64175 返信
    
    名無しさん
    
    ローカルで完結するならプライバシー問題はほぼないでしょ。それよりライセンスがどうなのか気になる。
- 2025年3月4日 6:05 AM #64178 返信
  
  名無しさん
  
  APIで使うよりローカルの方がコスト抑えられるって意見あったけど、電気代考えるとどっちが得なんだろう。
  - 2025年3月4日 6:11 AM #64179 返信
    
    名無しさん
    
    頻繁に使うならAPIの従量課金より安いかもね。でもキャッシュとかうまく使えば節約できる。
- 2025年3月4日 6:23 AM #64180 返信
  
  名無しさん
  
  とりあえず試してみたいけど、まだモデルサイズが大きいな。次の量子化でさらに軽くなるのを待つか。
  - 2025年3月4日 6:24 AM #64181 返信
    
    名無しさん
    
    既にGGUF形式で出てるよ。今のところInt4だけど、そのうちInt3とかも出てくるんじゃないかな。
投稿者

投稿

14件の返信を表示中（うち親返信6件）

返信先: DeepSeek V4 Flash-Base-Int4量子化モデル、ローカルで動かしてみたで#64177に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック