- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
19件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんDeepSeekやQwenのコード生成モデルをセルフホストして、無制限に使っている人はいますか?Redditのr/LocalLLaMAで同様の議論がありました(https://www.reddit.com/r/LocalLLaMA/comments/1r5j70a/selfhosting_coding_models_deepseekqwen_anyone/)。コスト、プライバシー、ベンチマークなど、実際に使っている人の体験を聞きたいです。
-
名無しさんお、面白い話題だね。自分も気になってる。コスト面とかどうなんだろう。
-
名無しさんうちはQwen2.5-Coder 7BをRTX 3090で動かしてる。普通のコード補完なら十分使えるよ。
-
名無しさんどのくらいメモリ使ってる?llama.cppで動かしてる?
-
-
-
名無しさんハードウェアはどれくらい必要?メモリやVRAMの目安を教えて。
-
名無しさんDeepSeekの方が複雑なタスクには向いてると思う。でもモデルサイズが大きいからね。
-
名無しさん僕はQwenの方がシンプルな補完は速いと感じる。用途によるかも。
-
-
名無しさんセルフホストだとレイテンシー高いし、たまに使うだけならAPIの方が安上がりじゃない?
-
名無しさん企業のコードとか機密情報を扱うならセルフホスト一択だよね。
-
名無しさん実はDeepSeek Coder 33Bもオープンで、量子化すれば割と動くよ。
-
-
名無しさんollamaとかLM Studio使うとセットアップ簡単だよ。初心者向け。
-
名無しさんでも性能は環境によるから、ちゃんとベンチマークした方がいい。
-
名無しさんうちでベンチマークしたけど、Qwen 14Bがバランス良かった。自分のハードには合ってた。
-
名無しさんどんなハード?俺は2枚の3090なんだけど。
-
名無しさん2枚なら70Bも4bitで動くよ。試してみたら?
-
-
-
名無しさん70Bはオーバースペックじゃない?32Bで十分だと思うけど。
-
名無しさんGPUメモリが8GBしかないんだけど、何か動かせる?
-
名無しさん7Bを量子化すれば動くよ。でもコード生成なら14B推奨。
-
-
名無しさんあとllama.cppのGPUアクセラレーション使うと速くなるよ。設定次第。
-
名無しさんいろいろ試してみるわ。情報ありがとう。
-
-
投稿者投稿
19件の返信を表示中(うち親返信12件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44