- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
22件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「192GB VRAMに最適なモデルは?DeepSeek v4 flashはどう?」というスレッドが立っていました。URL:
-
名無しさん192GBだと70Bモデルを余裕で動かせるね。DeepSeek v4 flashは量子化なしで収まるのか気になる。
-
名無しさん70Bでも量子化次第だよね。FP8なら192GBで行けるけど、速度はどうなんだろ。
-
-
名無しさんうちは128GBだけど、v4 flashは4bit量子化で動いてる。結構速いよ。
-
名無しさんコーディング用途ならCodeLlamaよりDeepSeekの方が良いって聞いたけど、実際どう?
-
名無しさん試した感じ、DeepSeek v4 flashはPythonなら優秀だけど、Javaだと微妙だった。
-
-
名無しさんコスト面で言うと、API使うよりローカル運用の方が長期的には安いのかな?
-
名無しさん電気代と初期投資考えると、月5000回以上呼ぶならローカルの方がいいかも。
-
-
名無しさんプライバシー重視ならローカル一択だけど、DeepSeekの中国製ってのが引っかかる人もいるみたい。
-
名無しさんそこは気にする人はLlama系にしとけば安心だろうね。
-
-
名無しさんベンチマークではDeepSeek v4 flashがLlama 3 70Bを超えてるらしいけど、実用的にはどうなんだ。
-
名無しさんうちの環境(3090×4)で試したら、Llama 3の方が推論速度は速かった。精度はDeepSeekの勝ちかな。
-
-
名無しさんそもそも192GBもあるなら、MoEモデルをフル精度で動かせるのもいいかも。
-
名無しさんMixtral 8x22Bはどう?確かVRAM 180GBくらいで収まるはず。
-
名無しさんMixtral 8x22B使ってるけど、DeepSeek v4 flashよりマルチタスク性能が高い気がする。
-
-
-
名無しさんv4 flashってv3の改良版?それとも完全新規?
-
名無しさんVRAM効率を改善したFlashAttention採用の派生版だよ。ベースはv3のアーキテクチャ。
-
-
名無しさん参考までに、今一番おすすめのモデルは何?予算はEUR5000くらい。
-
名無しさんその予算なら中古のA6000 48GB×4枚買えるけど、DeepSeek v4 flash使うならNVLink要るよ。
-
-
名無しさんAPIで事足りてるから、ローカルに興味はあるけど踏み切れないな。
-
名無しさん最初は7Bモデルで遊んでみるといいよ。すぐにハマるからw
-
-
名無しさんDeepSeek v4 flashの公式ベンチ、BLOOMと比べてどうなん?
-
名無しさんBLOOMよりだいぶ優秀。特にコーディングと数学で差がついてる印象。
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信11件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34