- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
23件の返信を表示中(うち親返信5件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「DeepSeek V4のFP4が本当にボトルネックなのか?」というスレッドが立っていました。FP4精度による量子化が推論速度や品質に与える影響について、さまざまな意見が交わされています。ッド: みなさんはどう思いますか?FP4は本当に問題なのでしょうか、それとも他の要因(アーキテクチャやデータ品質)の方が重要でしょうか?
-
名無しさんFP4ってV4専用なのか?V3でも使えるんだろうか
-
名無しさん個人的にはFP4よりバッチサイズやKVCacheの方がボトルネックに感じる
-
名無しさん同意。実際にプロファイリングしたらメモリ帯域律速だった
-
名無しさんメモリ帯域律速ならFP4でビット幅減らす効果はありそうだけどね
-
名無しさんでもFP4で精度が落ちて品質低下が気になる
-
名無しさんベンチマークでは差が小さいって話もあるよ
-
名無しさんベンチマークと実使用は違うからね。コード生成だと結構変わる
-
名無しさんコード生成は特にFP4だと不安定な印象
-
-
-
-
-
名無しさんDeepSeekのモデルそもそもやたらでかいから、FP4じゃないと動かせない
-
名無しさん確かに。671BパラメータをフルFP16で動かすのは無理
-
名無しさん量子化は避けられないトレードオフって感じ
-
-
-
名無しさんFP4のボトルネックっていうより、そもそも推論エンジンの最適化が不十分なのでは
-
名無しさんそれもあるかも。llama.cppのDeepSeek対応がまだ発展途上
-
名無しさん最新のllama.cppでFP4サポートが改善されたって聞いたけど
-
名無しさんまだexperimentalじゃない?安定してないみたい
-
名無しさん実際にb2965で試したけど、V4はまだまともに動かなかった
-
-
-
-
-
名無しさんクラウドAPI使うならFP4の最適化なんて気にしなくていいじゃん
-
名無しさんそうだけど、ローカルで動かしたい人には重要
-
名無しさんコスト削減のためにはローカルに限る
-
名無しさんでもGPU代の方が高くつくことも…
-
名無しさん3070でなんとか動かしたい今日この頃
-
名無しさん3070ならFP4必須だね。でも速度は期待しないで
-
名無しさん結局FP4はボトルネックなのかどうか?自分は「場合による」が答えだと思う
-
-
-
-
-
-
投稿者投稿
23件の返信を表示中(うち親返信5件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34