- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより11ヶ月、 3週前に更新されました。
26件の返信を表示中(うち親返信15件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「Deepseek v4 flash weird sizes?」というスレッドが立っていました。DeepSeek v4のFlash版が通常版と比べてサイズがおかしいという話題です。
このフォーラムでもDeepSeekモデルをローカルで動かしてる人いる?サイズの違いや性能について議論しましょう。 -
名無しさん俺も気になってた。Flash版って通常版よりパラメータ少ないはずなのにファイルサイズ大きいんだよな。
-
名無しさん量子化の方式が違うんじゃない?FP8とかINT4とか。
-
名無しさん実際に使ってみたけど、Flash版の方が推論速い気がする。メモリ使用量も少ないし。
-
名無しさん速いのは同意だけど、精度は落ちてない?ベンチマーク取ってみたい。
-
-
名無しさんサイズがおかしいって具体的にどのくらい違うの?
-
名無しさん通常版が7Bで約4GB、Flash版が同じ7Bで6GB超えてた。圧縮形式の違いかも。
-
-
名無しさんRedditのも話題になってたけど、実際にダウンロードして比べた人いる?
-
名無しさん自分は両方試した。Flash版の方がVRAM消費少なくて助かる。ただ出力品質はやや劣る。
-
名無しさん品質の差ってコーディングタスクで顕著に出る?
-
名無しさん簡単なコード生成なら問題ないけど、複雑なロジックだとたまに変な出力する。
-
-
-
名無しさんDeepSeek自体日本ではまだマイナーだけど、コスパ良いよな。
-
名無しさんAPI使ってる?ローカル派?
-
名無しさんローカル派。プライバシー気になるし、最近のモデルは自前でも結構使える。
-
名無しさん同じく。でもFlash版のサイズ違いは謎だな。もしかしてバグ?
-
-
-
名無しさんHugging Faceで見たけど、Flash版の方がファイル数多いね。シャーディングの仕方の違いか。
-
名無しさんそれだ。パラメータ数同じでもシャーディングでファイルサイズ変わることある。
-
-
名無しさん個人的には通常版で十分。速度より品質重視。
-
名無しさんでもGPU貧乏にはFlash版ありがたい。RTX3060でも動く。
-
名無しさん3060で動く?VRAM12GBで?教えてほしい。
-
名無しさん4bit量子化すれば余裕。Flash版だとさらに余裕。
-
-
-
名無しさんRedditではサイズの話だけで性能比較あまりされてなかったから、ここで議論できて嬉しい。
-
名無しさん今後のDeepSeek v5に期待。中国製モデルも馬鹿にできないね。
-
名無しさんでも政治的なバイアスとか大丈夫?
-
名無しさんそれは気になる。ローカルで使う分には調整できるけど。
-
-
-
名無しさんとりあえず今はFlash版使ってる。サイズがおかしいのは気にしないことにした。
-
名無しさんみんなの意見参考になる。自分もFlash版試してみようかな。
-
-
投稿者投稿
26件の返信を表示中(うち親返信15件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01