DeepSeek v4 Flashの変なサイズについて

名無しさん · 2025-07-05T03:34:25+09:00

Redditのr/LocalLLaMAで「Deepseek v4 flash weird sizes?」というスレッドが立っていました。DeepSeek v4のFlash版が通常版と比べてサイズがおかしいという話題です。このフォーラムでもDeepSeekモデルをローカルで動かしてる人いる？サイズの違いや性能について議論しましょう。

このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより11ヶ月、 3週前に更新されました。

26件の返信を表示中（うち親返信15件）

投稿者

投稿
- 2025年7月5日 3:34 AM #64215 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで「Deepseek v4 flash weird sizes?」というスレッドが立っていました。DeepSeek v4のFlash版が通常版と比べてサイズがおかしいという話題です。
  このフォーラムでもDeepSeekモデルをローカルで動かしてる人いる？サイズの違いや性能について議論しましょう。
- 2025年7月5日 3:36 AM #64216 返信
  
  名無しさん
  
  俺も気になってた。Flash版って通常版よりパラメータ少ないはずなのにファイルサイズ大きいんだよな。
- 2025年7月5日 3:39 AM #64217 返信
  
  名無しさん
  
  量子化の方式が違うんじゃない？FP8とかINT4とか。
- 2025年7月5日 3:43 AM #64218 返信
  
  名無しさん
  
  実際に使ってみたけど、Flash版の方が推論速い気がする。メモリ使用量も少ないし。
  - 2025年7月5日 3:50 AM #64219 返信
    
    名無しさん
    
    速いのは同意だけど、精度は落ちてない？ベンチマーク取ってみたい。
- 2025年7月5日 3:52 AM #64220 返信
  
  名無しさん
  
  サイズがおかしいって具体的にどのくらい違うの？
  - 2025年7月5日 3:55 AM #64221 返信
    
    名無しさん
    
    通常版が7Bで約4GB、Flash版が同じ7Bで6GB超えてた。圧縮形式の違いかも。
- 2025年7月5日 4:01 AM #64222 返信
  
  名無しさん
  
  Redditのも話題になってたけど、実際にダウンロードして比べた人いる？
- 2025年7月5日 4:10 AM #64223 返信
  
  名無しさん
  
  自分は両方試した。Flash版の方がVRAM消費少なくて助かる。ただ出力品質はやや劣る。
  - 2025年7月5日 4:12 AM #64224 返信
    
    名無しさん
    
    品質の差ってコーディングタスクで顕著に出る？
    - 2025年7月5日 4:14 AM #64225 返信
      
      名無しさん
      
      簡単なコード生成なら問題ないけど、複雑なロジックだとたまに変な出力する。
- 2025年7月5日 4:18 AM #64226 返信
  
  名無しさん
  
  DeepSeek自体日本ではまだマイナーだけど、コスパ良いよな。
- 2025年7月5日 4:25 AM #64227 返信
  
  名無しさん
  
  API使ってる？ローカル派？
  - 2025年7月5日 4:36 AM #64228 返信
    
    名無しさん
    
    ローカル派。プライバシー気になるし、最近のモデルは自前でも結構使える。
    - 2025年7月5日 4:38 AM #64229 返信
      
      名無しさん
      
      同じく。でもFlash版のサイズ違いは謎だな。もしかしてバグ？
- 2025年7月5日 4:41 AM #64230 返信
  
  名無しさん
  
  Hugging Faceで見たけど、Flash版の方がファイル数多いね。シャーディングの仕方の違いか。
  - 2025年7月5日 4:46 AM #64231 返信
    
    名無しさん
    
    それだ。パラメータ数同じでもシャーディングでファイルサイズ変わることある。
- 2025年7月5日 4:53 AM #64232 返信
  
  名無しさん
  
  個人的には通常版で十分。速度より品質重視。
- 2025年7月5日 4:56 AM #64233 返信
  
  名無しさん
  
  でもGPU貧乏にはFlash版ありがたい。RTX3060でも動く。
  - 2025年7月5日 4:59 AM #64234 返信
    
    名無しさん
    
    3060で動く？VRAM12GBで？教えてほしい。
    - 2025年7月5日 5:05 AM #64235 返信
      
      名無しさん
      
      4bit量子化すれば余裕。Flash版だとさらに余裕。
- 2025年7月5日 5:15 AM #64236 返信
  
  名無しさん
  
  Redditではサイズの話だけで性能比較あまりされてなかったから、ここで議論できて嬉しい。
- 2025年7月5日 5:16 AM #64237 返信
  
  名無しさん
  
  今後のDeepSeek v5に期待。中国製モデルも馬鹿にできないね。
  - 2025年7月5日 5:19 AM #64238 返信
    
    名無しさん
    
    でも政治的なバイアスとか大丈夫？
    - 2025年7月5日 5:23 AM #64239 返信
      
      名無しさん
      
      それは気になる。ローカルで使う分には調整できるけど。
- 2025年7月5日 5:30 AM #64240 返信
  
  名無しさん
  
  とりあえず今はFlash版使ってる。サイズがおかしいのは気にしないことにした。
- 2025年7月5日 5:42 AM #64241 返信
  
  名無しさん
  
  みんなの意見参考になる。自分もFlash版試してみようかな。
投稿者

投稿

26件の返信を表示中（うち親返信15件）

返信先: DeepSeek v4 Flashの変なサイズについてで#64220に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック