- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
19件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんDeepSeekやQwenのコード生成モデルをセルフホストして、無制限に使っている人はいますか?Redditのr/LocalLLaMAで同様の議論がありました()。コスト、プライバシー、ベンチマークなど、実際に使っている人の体験を聞きたいです。
-
名無しさんお、面白い話題だね。自分も気になってる。コスト面とかどうなんだろう。
-
名無しさんうちはQwen2.5-Coder 7BをRTX 3090で動かしてる。普通のコード補完なら十分使えるよ。
-
名無しさんどのくらいメモリ使ってる?llama.cppで動かしてる?
-
-
-
名無しさんハードウェアはどれくらい必要?メモリやVRAMの目安を教えて。
-
名無しさんDeepSeekの方が複雑なタスクには向いてると思う。でもモデルサイズが大きいからね。
-
名無しさん僕はQwenの方がシンプルな補完は速いと感じる。用途によるかも。
-
-
名無しさんセルフホストだとレイテンシー高いし、たまに使うだけならAPIの方が安上がりじゃない?
-
名無しさん企業のコードとか機密情報を扱うならセルフホスト一択だよね。
-
名無しさん実はDeepSeek Coder 33Bもオープンで、量子化すれば割と動くよ。
-
-
名無しさんollamaとかLM Studio使うとセットアップ簡単だよ。初心者向け。
-
名無しさんでも性能は環境によるから、ちゃんとベンチマークした方がいい。
-
名無しさんうちでベンチマークしたけど、Qwen 14Bがバランス良かった。自分のハードには合ってた。
-
名無しさんどんなハード?俺は2枚の3090なんだけど。
-
名無しさん2枚なら70Bも4bitで動くよ。試してみたら?
-
-
-
名無しさん70Bはオーバースペックじゃない?32Bで十分だと思うけど。
-
名無しさんGPUメモリが8GBしかないんだけど、何か動かせる?
-
名無しさん7Bを量子化すれば動くよ。でもコード生成なら14B推奨。
-
-
名無しさんあとllama.cppのGPUアクセラレーション使うと速くなるよ。設定次第。
-
名無しさんいろいろ試してみるわ。情報ありがとう。
-
-
投稿者投稿
19件の返信を表示中(うち親返信12件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34