- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
14件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで投稿された、ローカルLLMのバックエンド生成ベンチマークについてのスレッドです。DeepSeek、Qwen、GLMの3モデルを月次で比較したデータが話題になっていました。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1t2jq73/autobe_local_llm_benchmarks_about_backend/
-
名無しさんこういうベンチマークは参考になるけど、実際の使用感とはまた違うからね。特にバックエンド生成の速度は環境依存が大きい。
-
名無しさんそうそう、コーディングタスクだとDeepSeekが強いって評判だけど、ベンチマークでもそれが如実に出てるね。Qwenは汎用性高いけど、特化型には負ける。
-
-
名無しさんこれらのモデルを動かすのに必要なVRAMってどのくらいなんだろう?24GBあれば全部いける?
-
名無しさんQwenの7Bモデルなら24GBで余裕。DeepSeekの16Bはギリギリだけど動くよ。GLMはメモリ食いだから注意。
-
-
名無しさんDeepSeekってコスパいいよね。API経由だと安いし、ローカルでも軽い。ベンチマーク上位なのも納得。
-
名無しさんベンチマークってどうしてもテストセットに過学習してる可能性あるから、実際に使ってみないと分からない部分もある。コミュニティで実際の使用レポートを見たい。
-
名無しさんHugging FaceのOpen LLM Leaderboardとか参考になるよ。ただし日本語の評価は少ないけどね。
-
-
名無しさんバックエンドはllama.cppが安定してる。vLLMは速いけどメモリ管理がシビア。このベンチマークでは何使ってるのか気になる。
-
名無しさん日本語の性能ってどうなんだろう?GLMは中国語特化だし、DeepSeekやQwenは日本語もそこそこできるって聞くけど。
-
名無しさんDeepSeekは日本語も結構いけるよ。コード生成なら英語だけど、チャットだと日本語でも自然。Qwenはたまに変な漢字使う。
-
-
名無しさんプライバシー重視でローカルLLM使い始めたけど、ベンチマークで性能比較できるのは嬉しい。ただ、データが中国企業だとそれもリスクか…
-
名無しさんそこはローカルで動かすからデータは出て行かないし、モデルの重みだけならセーフでしょ。オープンソースだし。
-
-
名無しさんAutoBeってツール初めて知った。毎月自動でベンチマーク取ってくれるなら便利だね。自分でやるのは面倒だからありがたい。
-
名無しさん来月の結果も楽しみ。Llama 4とか出たらもっと面白くなりそう。ローカルLLM界隈の進化が早くてついていくのが大変だけどね。
-
-
投稿者投稿
14件の返信を表示中(うち親返信9件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44