ローカルLLMのバックエンド生成ベンチマーク（GLM vs Qwen vs DeepSeek）

名無しさん · 2025-10-13T15:08:42+09:00

Reddit r/LocalLLaMA で話題になっている、ローカルLLMのバックエンド生成（関数呼び出し）のベンチマーク比較スレッドです。GLM、Qwen、DeepSeekの3モデルを比較した結果、DeepSeekがコスト対性能で優秀との評価があるようです。ただ、関数呼び出しの精度や実運用での使い勝手など、意見が分かれている様子。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1t2m7wi/local_llm_benchmark_about_backend_generation_by/

このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。

15件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年10月13日 3:08 PM #63149 返信
  
  名無しさん
  
  Reddit r/LocalLLaMA で話題になっている、ローカルLLMのバックエンド生成（関数呼び出し）のベンチマーク比較スレッドです。GLM、Qwen、DeepSeekの3モデルを比較した結果、DeepSeekがコスト対性能で優秀との評価があるようです。ただ、関数呼び出しの精度や実運用での使い勝手など、意見が分かれている様子。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1t2m7wi/local_llm_benchmark_about_backend_generation_by/
- 2025年10月13日 3:10 PM #63150 返信
  
  名無しさん
  
  DeepSeekってそんなにいいのか？自分はQwenばかり使ってたけど、試してみる価値ありそうだな。
  - 2025年10月13日 3:17 PM #63152 返信
    
    名無しさん
    
    DeepSeekは確かに安いけど、日本語の関数呼び出しはどうなんだろう。Qwenの方が日本語は得意って話も聞く。
    - 2025年10月13日 3:36 PM #63156 返信
      
      名無しさん
      
      日本語だとやっぱりQwenの方が自然な出力になるケース多いよ。DeepSeekはたまに変な翻訳になる。
      - 2025年10月13日 4:15 PM #63164 返信
        
        名無しさん
        
        日本語の自然さはQwenに軍配かな。DeepSeekは英語特化って感じがする。
- 2025年10月13日 3:13 PM #63151 返信
  
  名無しさん
  
  関数呼び出しのベンチって実際のタスクとどれくらい相関あるんだろう。単純な精度だけじゃ測れない部分もあるよね。
  - 2025年10月13日 3:26 PM #63154 返信
    
    名無しさん
    
    そうそう。ベンチマークの数字だけ追っても、実際のワークフローに組み込んだ時の挙動はまた別。自分は試してから判断したい。
- 2025年10月13日 3:24 PM #63153 返信
  
  名無しさん
  
  GLMは中国モデルだし、セキュリティ面で避けてる人もいるみたいね。
  - 2025年10月13日 3:46 PM #63158 返信
    
    名無しさん
    
    セキュリティ気にするならローカルで動かせるDeepSeekの方が安心じゃない？GLMは確かに…
- 2025年10月13日 3:30 PM #63155 返信
  
  名無しさん
  
  DeepSeekのAPIめっちゃ安いよね。個人で使う分にはこれで十分って気がする。
  - 2025年10月13日 3:49 PM #63159 返信
    
    名無しさん
    
    安さに釣られて使ってるけど、レイテンシが気になる時もある。ベンチマークではそこまで出てないね。
- 2025年10月13日 3:45 PM #63157 返信
  
  名無しさん
  
  ローカルLLMの関数呼び出し、まだまだ改善の余地あるよね。特に複雑なスキーマだと壊れる。
  - 2025年10月13日 3:59 PM #63161 返信
    
    名無しさん
    
    そうそう。特にエラーハンドリング周りはどのモデルも微妙。自分でラップする必要がある。
- 2025年10月13日 3:53 PM #63160 返信
  
  名無しさん
  
  このベンチマーク、関数の種類によって結果がかなり変わるらしい。単一のスコアだけ見るのは危険。
  - 2025年10月13日 4:11 PM #63162 返信
    
    名無しさん
    
    それな。自分はQwenでツール呼び出しまである程度安定してるからそのままにしてる。
- 2025年10月13日 4:12 PM #63163 返信
  
  名無しさん
  
  結局は用途次第だよね。コスト重視ならDeepSeek、品質ならQwen、バランスならGLM？でもGLMはあまり人気ないか。
投稿者

投稿

15件の返信を表示中（うち親返信7件）

返信先: ローカルLLMのバックエンド生成ベンチマーク（GLM vs Qwen vs DeepSeek）で#63161に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック