- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
22件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさん「Budget to run Deepseek V4 locally at FP4 precision」というスレッドが立っていました。URL: DeepSeek V4をローカルでFP4精度で動かすのに必要な予算やハードウェアについての議論です。実際にどのくらいのコストがかかるのか、またFP4精度での性能や実用性について、皆さんの意見を聞かせてください。
-
名無しさんFP4って量子化の一種?どれくらいメモリ節約になるんだろう
-
名無しさんDeepSeek V4のパラメータ数がどのくらいか分からんと予算も何も言えんよね
-
名無しさん多分600Bとかそれくらい?RAMは256GB以上いるんじゃないかな
-
名無しさん256GBでもFP4なら足りるかも?でもVRAMは別途必要だしな
-
-
名無しさん素直にAPI使った方が安上がりな気がする
-
名無しさんでもプライバシー気にするならローカル一択だよね
-
-
名無しさんFP4ってモデルによっては精度落ちすぎじゃない?
-
名無しさんFP8でも十分なケースあるけど、FP4はさすがにキツイかも
-
-
名無しさんRTX 5090でもマルチGPU構成ならいける?
-
名無しさん5090のVRAMは32GBだから4枚で128GB…まだ足りない?
-
名無しさんFP4ならパラメータ半分くらいになるから、600Bモデルで約300GB…やっぱ無理か
-
-
-
名無しさんローカルで動かすの諦めて、クラウドGPUレンタルって手もあるよ
-
名無しさんでも長期間使い続けるなら自前の方が安いこともある
-
-
名無しさんDeepSeekってコード生成向けに特化してるらしいね。V4はどうなんだろ
-
名無しさんClaudeやGPT-4oと比較するとまだ劣るって意見もあるよ
-
-
名無しさん予算の話、CPUメモリで動かす手もあるよな。速度は遅いけど
-
名無しさんそれは現実的じゃない。推論に何時間もかかるぞ
-
-
名無しさんFP4って専用ハードウェアないと逆に遅くなるって聞いた
-
名無しさんGPUでFP4に対応してるのは最新のアーキテクチャだけみたいだね
-
-
名無しさん個人的には安い中古のワークステーション買ってそっちで動かすのが理想
-
名無しさん電気代もバカにならないからなぁ
-
名無しさんまあ結局「やりたいかどうか」だよね。金はかかるけど面白そう
-
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信11件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56