- このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
21件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA より、ローカルLLMの選び方についての議論を紹介します。元スレッドは「コーディングとデータ分析に使うなら、3090/4090デュアルでどのモデルがベストか?」という質問が中心。かつてはDeepseek-r1:70bが定番だったが、コンテキスト長や更新の古さが課題との意見。コストやプライバシー、ベンチマーク比較なども話題に。以下、意見をまとめました。
ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s2hgu1/whats_the_goto_model_for_coding_and_analytics_for/ -
名無しさん俺も3090デュアルだけど、最近はQwen2.5-Coder-32Bが結構いいって聞いて試してる。
-
名無しさんQwen2.5-Coderは確かにコード生成強いけど、分析系だとどうなんだろう?
-
-
名無しさんDeepseek-r1は確かにちょっと古いよね。でも70Bでこの性能はまだ侮れない。
-
名無しさん自分はmixtral 8x22bをq4で動かしてる。VRAM厳しいけど質は高い。
-
名無しさんmixtralは推論遅くない?3090でもちょっとキツイかも。
-
-
名無しさんllama3.1 70bはどう?指令追従はいいけどコードはちょっと微妙って噂。
-
名無しさん確かにllama3.1はチャット向けで、コーディング特化ではない感じ。
-
-
名無しさん結局、用途次第だよね。コードメインならcodestralとかの専用モデルも視野に。
-
名無しさんcodestralはAPIが高いし、ローカルで動かせないのが痛い。
-
-
名無しさん自分はdeepseek-coder-v2をbfloat16で動かしてる。結構満足。
-
名無しさんそれ、VRAMどのくらい使う?3090×2で足りる?
-
名無しさん僕の構成だと48GBでQ4ならなんとか。コンテキスト長は控えめにね。
-
-
-
名無しさんコンテキスト長がネックだよね。128k欲しいけど、VRAM食いすぎる。
-
名無しさん最近のモデルは32kでも結構使えるよ。短めのコードなら問題ない。
-
-
名無しさんプライバシー重視でローカルにこだわるけど、クラウドの方が速いし安い場合もあるよね。
-
名無しさんそれはそう。でも個人データを外に出したくないケースではローカル一択。
-
-
名無しさん評価ベンチマーク見ると、Qwen2.5-72Bがコードと分析ともにトップだった。でもデュアルじゃギリかも。
-
名無しさん72Bって3090×2じゃQ4でもきつくない?推論速度が気になる。
-
名無しさんやってる人いるけど、スループット落ちるみたい。実用はキツイかも。
-
-
-
名無しさん結局、今のところコスパと性能のバランスだとdeepseek-r1かQwen2.5-32Bが無難な気がする。
-
名無しさんそれに一票。特に分析ならQwenの方が体系的で良いと思う。
-
-
-
投稿者投稿
21件の返信を表示中(うち親返信10件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44