- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
26件の返信を表示中(うち親返信15件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「Deepseek v4 flash weird sizes?」というスレッドが立っていました。DeepSeek v4のFlash版が通常版と比べてサイズがおかしいという話題です。
このフォーラムでもDeepSeekモデルをローカルで動かしてる人いる?サイズの違いや性能について議論しましょう。 -
名無しさん俺も気になってた。Flash版って通常版よりパラメータ少ないはずなのにファイルサイズ大きいんだよな。
-
名無しさん量子化の方式が違うんじゃない?FP8とかINT4とか。
-
名無しさん実際に使ってみたけど、Flash版の方が推論速い気がする。メモリ使用量も少ないし。
-
名無しさん速いのは同意だけど、精度は落ちてない?ベンチマーク取ってみたい。
-
-
名無しさんサイズがおかしいって具体的にどのくらい違うの?
-
名無しさん通常版が7Bで約4GB、Flash版が同じ7Bで6GB超えてた。圧縮形式の違いかも。
-
-
名無しさんRedditのも話題になってたけど、実際にダウンロードして比べた人いる?
-
名無しさん自分は両方試した。Flash版の方がVRAM消費少なくて助かる。ただ出力品質はやや劣る。
-
名無しさん品質の差ってコーディングタスクで顕著に出る?
-
名無しさん簡単なコード生成なら問題ないけど、複雑なロジックだとたまに変な出力する。
-
-
-
名無しさんDeepSeek自体日本ではまだマイナーだけど、コスパ良いよな。
-
名無しさんAPI使ってる?ローカル派?
-
名無しさんローカル派。プライバシー気になるし、最近のモデルは自前でも結構使える。
-
名無しさん同じく。でもFlash版のサイズ違いは謎だな。もしかしてバグ?
-
-
-
名無しさんHugging Faceで見たけど、Flash版の方がファイル数多いね。シャーディングの仕方の違いか。
-
名無しさんそれだ。パラメータ数同じでもシャーディングでファイルサイズ変わることある。
-
-
名無しさん個人的には通常版で十分。速度より品質重視。
-
名無しさんでもGPU貧乏にはFlash版ありがたい。RTX3060でも動く。
-
名無しさん3060で動く?VRAM12GBで?教えてほしい。
-
名無しさん4bit量子化すれば余裕。Flash版だとさらに余裕。
-
-
-
名無しさんRedditではサイズの話だけで性能比較あまりされてなかったから、ここで議論できて嬉しい。
-
名無しさん今後のDeepSeek v5に期待。中国製モデルも馬鹿にできないね。
-
名無しさんでも政治的なバイアスとか大丈夫?
-
名無しさんそれは気になる。ローカルで使う分には調整できるけど。
-
-
-
名無しさんとりあえず今はFlash版使ってる。サイズがおかしいのは気にしないことにした。
-
名無しさんみんなの意見参考になる。自分もFlash版試してみようかな。
-
-
投稿者投稿
26件の返信を表示中(うち親返信15件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34