- このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
21件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさん、ローカルLLMの選び方についての議論を紹介します。ッドは「コーディングとデータ分析に使うなら、3090/4090デュアルでどのモデルがベストか?」という質問が中心。かつてはDeepseek-r1:70bが定番だったが、コンテキスト長や更新の古さが課題との意見。コストやプライバシー、ベンチマーク比較なども話題に。以下、意見をまとめました。
-
名無しさん俺も3090デュアルだけど、最近はQwen2.5-Coder-32Bが結構いいって聞いて試してる。
-
名無しさんQwen2.5-Coderは確かにコード生成強いけど、分析系だとどうなんだろう?
-
-
名無しさんDeepseek-r1は確かにちょっと古いよね。でも70Bでこの性能はまだ侮れない。
-
名無しさん自分はmixtral 8x22bをq4で動かしてる。VRAM厳しいけど質は高い。
-
名無しさんmixtralは推論遅くない?3090でもちょっとキツイかも。
-
-
名無しさんllama3.1 70bはどう?指令追従はいいけどコードはちょっと微妙って噂。
-
名無しさん確かにllama3.1はチャット向けで、コーディング特化ではない感じ。
-
-
名無しさん結局、用途次第だよね。コードメインならcodestralとかの専用モデルも視野に。
-
名無しさんcodestralはAPIが高いし、ローカルで動かせないのが痛い。
-
-
名無しさん自分はdeepseek-coder-v2をbfloat16で動かしてる。結構満足。
-
名無しさんそれ、VRAMどのくらい使う?3090×2で足りる?
-
名無しさん僕の構成だと48GBでQ4ならなんとか。コンテキスト長は控えめにね。
-
-
-
名無しさんコンテキスト長がネックだよね。128k欲しいけど、VRAM食いすぎる。
-
名無しさん最近のモデルは32kでも結構使えるよ。短めのコードなら問題ない。
-
-
名無しさんプライバシー重視でローカルにこだわるけど、クラウドの方が速いし安い場合もあるよね。
-
名無しさんそれはそう。でも個人データを外に出したくないケースではローカル一択。
-
-
名無しさん評価ベンチマーク見ると、Qwen2.5-72Bがコードと分析ともにトップだった。でもデュアルじゃギリかも。
-
名無しさん72Bって3090×2じゃQ4でもきつくない?推論速度が気になる。
-
名無しさんやってる人いるけど、スループット落ちるみたい。実用はキツイかも。
-
-
-
名無しさん結局、今のところコスパと性能のバランスだとdeepseek-r1かQwen2.5-32Bが無難な気がする。
-
名無しさんそれに一票。特に分析ならQwenの方が体系的で良いと思う。
-
-
-
投稿者投稿
21件の返信を表示中(うち親返信10件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34