- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
22件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「192GB VRAMに最適なモデルは?DeepSeek v4 flashはどう?」というスレッドが立っていました。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1szexey/best_model_for_192_gb_vram_hows_deepseek_v4_flash/。この質問を基に、ローカルLLM運用、コーディング性能、コスト、プライバシー、ベンチマーク比較などについて議論しましょう。
-
名無しさん192GBだと70Bモデルを余裕で動かせるね。DeepSeek v4 flashは量子化なしで収まるのか気になる。
-
名無しさん70Bでも量子化次第だよね。FP8なら192GBで行けるけど、速度はどうなんだろ。
-
-
名無しさんうちは128GBだけど、v4 flashは4bit量子化で動いてる。結構速いよ。
-
名無しさんコーディング用途ならCodeLlamaよりDeepSeekの方が良いって聞いたけど、実際どう?
-
名無しさん試した感じ、DeepSeek v4 flashはPythonなら優秀だけど、Javaだと微妙だった。
-
-
名無しさんコスト面で言うと、API使うよりローカル運用の方が長期的には安いのかな?
-
名無しさん電気代と初期投資考えると、月5000回以上呼ぶならローカルの方がいいかも。
-
-
名無しさんプライバシー重視ならローカル一択だけど、DeepSeekの中国製ってのが引っかかる人もいるみたい。
-
名無しさんそこは気にする人はLlama系にしとけば安心だろうね。
-
-
名無しさんベンチマークではDeepSeek v4 flashがLlama 3 70Bを超えてるらしいけど、実用的にはどうなんだ。
-
名無しさんうちの環境(3090×4)で試したら、Llama 3の方が推論速度は速かった。精度はDeepSeekの勝ちかな。
-
-
名無しさんそもそも192GBもあるなら、MoEモデルをフル精度で動かせるのもいいかも。
-
名無しさんMixtral 8x22Bはどう?確かVRAM 180GBくらいで収まるはず。
-
名無しさんMixtral 8x22B使ってるけど、DeepSeek v4 flashよりマルチタスク性能が高い気がする。
-
-
-
名無しさんv4 flashってv3の改良版?それとも完全新規?
-
名無しさんVRAM効率を改善したFlashAttention採用の派生版だよ。ベースはv3のアーキテクチャ。
-
-
名無しさん参考までに、今一番おすすめのモデルは何?予算はEUR5000くらい。
-
名無しさんその予算なら中古のA6000 48GB×4枚買えるけど、DeepSeek v4 flash使うならNVLink要るよ。
-
-
名無しさんAPIで事足りてるから、ローカルに興味はあるけど踏み切れないな。
-
名無しさん最初は7Bモデルで遊んでみるといいよ。すぐにハマるからw
-
-
名無しさんDeepSeek v4 flashの公式ベンチ、BLOOMと比べてどうなん?
-
名無しさんBLOOMよりだいぶ優秀。特にコーディングと数学で差がついてる印象。
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2026年2月11日 13:57
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2026年2月11日 06:39
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44