- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより10ヶ月、 3週前に更新されました。
19件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんDeepSeekやQwenのコード生成モデルをセルフホストして、無制限に使っている人はいますか?Redditのr/LocalLLaMAで同様の議論がありました()。コスト、プライバシー、ベンチマークなど、実際に使っている人の体験を聞きたいです。
-
名無しさんお、面白い話題だね。自分も気になってる。コスト面とかどうなんだろう。
-
名無しさんうちはQwen2.5-Coder 7BをRTX 3090で動かしてる。普通のコード補完なら十分使えるよ。
-
名無しさんどのくらいメモリ使ってる?llama.cppで動かしてる?
-
-
-
名無しさんハードウェアはどれくらい必要?メモリやVRAMの目安を教えて。
-
名無しさんDeepSeekの方が複雑なタスクには向いてると思う。でもモデルサイズが大きいからね。
-
名無しさん僕はQwenの方がシンプルな補完は速いと感じる。用途によるかも。
-
-
名無しさんセルフホストだとレイテンシー高いし、たまに使うだけならAPIの方が安上がりじゃない?
-
名無しさん企業のコードとか機密情報を扱うならセルフホスト一択だよね。
-
名無しさん実はDeepSeek Coder 33Bもオープンで、量子化すれば割と動くよ。
-
-
名無しさんollamaとかLM Studio使うとセットアップ簡単だよ。初心者向け。
-
名無しさんでも性能は環境によるから、ちゃんとベンチマークした方がいい。
-
名無しさんうちでベンチマークしたけど、Qwen 14Bがバランス良かった。自分のハードには合ってた。
-
名無しさんどんなハード?俺は2枚の3090なんだけど。
-
名無しさん2枚なら70Bも4bitで動くよ。試してみたら?
-
-
-
名無しさん70Bはオーバースペックじゃない?32Bで十分だと思うけど。
-
名無しさんGPUメモリが8GBしかないんだけど、何か動かせる?
-
名無しさん7Bを量子化すれば動くよ。でもコード生成なら14B推奨。
-
-
名無しさんあとllama.cppのGPUアクセラレーション使うと速くなるよ。設定次第。
-
名無しさんいろいろ試してみるわ。情報ありがとう。
-
-
投稿者投稿
19件の返信を表示中(うち親返信12件)
関連するAIトピック
- DeepSeekがGPT-5を暗号通貨トレードで上回った?議論19件の返信最終更新 2025年12月11日 17:46
- DeepSeek 671Bをllama.cppで8xRTX PRO 6000Sで動かしたベンチマーク結果13件の返信最終更新 2025年8月25日 21:41
- DeepSeek V4の新情報?Model1って何だ?24件の返信最終更新 2025年8月26日 00:57
- DeepSeek v3 0324 API、レート制限なしになったってホント?15件の返信最終更新 2025年8月26日 04:25
- DeepSeek V3.1:671b-cloud、本当に実在するらしい23件の返信最終更新 2025年8月25日 10:07