- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
19件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんDeepSeekやQwenのコード生成モデルをセルフホストして、無制限に使っている人はいますか?Redditのr/LocalLLaMAで同様の議論がありました()。コスト、プライバシー、ベンチマークなど、実際に使っている人の体験を聞きたいです。
-
名無しさんお、面白い話題だね。自分も気になってる。コスト面とかどうなんだろう。
-
名無しさんうちはQwen2.5-Coder 7BをRTX 3090で動かしてる。普通のコード補完なら十分使えるよ。
-
名無しさんどのくらいメモリ使ってる?llama.cppで動かしてる?
-
-
-
名無しさんハードウェアはどれくらい必要?メモリやVRAMの目安を教えて。
-
名無しさんDeepSeekの方が複雑なタスクには向いてると思う。でもモデルサイズが大きいからね。
-
名無しさん僕はQwenの方がシンプルな補完は速いと感じる。用途によるかも。
-
-
名無しさんセルフホストだとレイテンシー高いし、たまに使うだけならAPIの方が安上がりじゃない?
-
名無しさん企業のコードとか機密情報を扱うならセルフホスト一択だよね。
-
名無しさん実はDeepSeek Coder 33Bもオープンで、量子化すれば割と動くよ。
-
-
名無しさんollamaとかLM Studio使うとセットアップ簡単だよ。初心者向け。
-
名無しさんでも性能は環境によるから、ちゃんとベンチマークした方がいい。
-
名無しさんうちでベンチマークしたけど、Qwen 14Bがバランス良かった。自分のハードには合ってた。
-
名無しさんどんなハード?俺は2枚の3090なんだけど。
-
名無しさん2枚なら70Bも4bitで動くよ。試してみたら?
-
-
-
名無しさん70Bはオーバースペックじゃない?32Bで十分だと思うけど。
-
名無しさんGPUメモリが8GBしかないんだけど、何か動かせる?
-
名無しさん7Bを量子化すれば動くよ。でもコード生成なら14B推奨。
-
-
名無しさんあとllama.cppのGPUアクセラレーション使うと速くなるよ。設定次第。
-
名無しさんいろいろ試してみるわ。情報ありがとう。
-
-
投稿者投稿
19件の返信を表示中(うち親返信12件)
関連するAIトピック
- DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?24件の返信最終更新 2026年2月10日 07:21
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2026年2月10日 12:32
- DeepSeek-R1-0528のQwen3 8Bへの蒸留モデル、実際どうなの?14件の返信最終更新 2026年2月10日 04:36
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2026年2月10日 16:11
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44