【AutoBe】ローカルLLMのバックエンド生成ベンチマーク月次比較:DeepSeek vs Qwen vs GLM

掲示板 フォーラム AI 【AutoBe】ローカルLLMのバックエンド生成ベンチマーク月次比較:DeepSeek vs Qwen vs GLM

  • このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
14件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #63089 返信
      名無しさん
      Redditのr/LocalLLaMAで投稿された、ローカルLLMのバックエンド生成ベンチマークについてのスレッドです。DeepSeek、Qwen、GLMの3モデルを月次で比較したデータが話題になっていました。URL:

    • #63090 返信
      名無しさん
      こういうベンチマークは参考になるけど、実際の使用感とはまた違うからね。特にバックエンド生成の速度は環境依存が大きい。

      • #63092 返信
        名無しさん
        そうそう、コーディングタスクだとDeepSeekが強いって評判だけど、ベンチマークでもそれが如実に出てるね。Qwenは汎用性高いけど、特化型には負ける。

    • #63091 返信
      名無しさん
      これらのモデルを動かすのに必要なVRAMってどのくらいなんだろう?24GBあれば全部いける?

      • #63093 返信
        名無しさん
        Qwenの7Bモデルなら24GBで余裕。DeepSeekの16Bはギリギリだけど動くよ。GLMはメモリ食いだから注意。

    • #63094 返信
      名無しさん
      DeepSeekってコスパいいよね。API経由だと安いし、ローカルでも軽い。ベンチマーク上位なのも納得。

    • #63095 返信
      名無しさん
      ベンチマークってどうしてもテストセットに過学習してる可能性あるから、実際に使ってみないと分からない部分もある。コミュニティで実際の使用レポートを見たい。

      • #63096 返信
        名無しさん
        Hugging FaceのOpen LLM Leaderboardとか参考になるよ。ただし日本語の評価は少ないけどね。

    • #63097 返信
      名無しさん
      バックエンドはllama.cppが安定してる。vLLMは速いけどメモリ管理がシビア。このベンチマークでは何使ってるのか気になる。

    • #63098 返信
      名無しさん
      日本語の性能ってどうなんだろう?GLMは中国語特化だし、DeepSeekやQwenは日本語もそこそこできるって聞くけど。

      • #63099 返信
        名無しさん
        DeepSeekは日本語も結構いけるよ。コード生成なら英語だけど、チャットだと日本語でも自然。Qwenはたまに変な漢字使う。

    • #63100 返信
      名無しさん
      プライバシー重視でローカルLLM使い始めたけど、ベンチマークで性能比較できるのは嬉しい。ただ、データが中国企業だとそれもリスクか…

      • #63101 返信
        名無しさん
        そこはローカルで動かすからデータは出て行かないし、モデルの重みだけならセーフでしょ。オープンソースだし。

    • #63102 返信
      名無しさん
      AutoBeってツール初めて知った。毎月自動でベンチマーク取ってくれるなら便利だね。自分でやるのは面倒だからありがたい。

    • #63103 返信
      名無しさん
      来月の結果も楽しみ。Llama 4とか出たらもっと面白くなりそう。ローカルLLM界隈の進化が早くてついていくのが大変だけどね。

14件の返信を表示中(うち親返信9件)
返信先: 【AutoBe】ローカルLLMのバックエンド生成ベンチマーク月次比較:DeepSeek vs Qwen vs GLMで#63102に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました