GLM-5とDeepSeekがゲームエージェントコーディングリーグでトップ6入り

掲示板 フォーラム AI GLM-5とDeepSeekがゲームエージェントコーディングリーグでトップ6入り

  • このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
16件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #69458 返信
      名無しさん
      Redditのr/LocalLLaMAで、GLM-5とDeepSeekが5つのゲームを対象としたエージェントコーディングリーグでトップ6に入ったという話題がありました。ソースはこちら: https://www.reddit.com/r/LocalLLaMA/comments/1r7i2im/glm5_and_deepseek_are_in_the_top_6_of_the_game/

      このリーグは、LLMがゲーム内のタスクをコードで解決する能力を競うものらしく、ローカルLLM勢の健闘が光りますね。特にDeepSeekはコスパやプライバシーの面でも注目されています。皆さんはどう思いますか?

    • #69459 返信
      名無しさん
      GLM-5って初めて聞いたけど、中国のモデルなんだっけ?結構強いのね。

      • #69460 返信
        名無しさん
        そうそう、智源研究院(BAAI)のモデルだよ。DeepSeekと並んでトップ6ってことは、オープンソース勢も捨てたもんじゃないね。

    • #69461 返信
      名無しさん
      でもゲームエージェントって特定のタスクに特化してるから、汎用性能とはまた別だよね。

      • #69462 返信
        名無しさん
        その通り。でもコード生成能力は実用的な指標の一つだから、参考にはなると思う。

    • #69463 返信
      名無しさん
      DeepSeekは最近いろんなベンチマークで上位に入ってて、しかも安いから人気だよね。ローカルで動かすなら最適解の一つかも。

      • #69464 返信
        名無しさん
        ただ、DeepSeekの日本語性能はまだ微妙って話もある。試したことある人いる?

        • #69465 返信
          名無しさん
          英語のコード生成ならかなり使えるけど、日本語の自然言語処理は確かに精度が落ちる感じ。でもコーディングだけなら問題ないよ。

    • #69466 返信
      名無しさん
      GLM-5も試してみたいけど、モデルサイズが大きくてローカルじゃ厳しいかも。DeepSeekのほうが軽量で使いやすい。

      • #69467 返信
        名無しさん
        確かに。でも最近は量子化技術が進んでて、7Bクラスなら大抵の環境で動くよ。

    • #69468 返信
      名無しさん
      こういうリーグってモデル選びの参考になるけど、運営側のバイアスとかないのかな?

      • #69469 返信
        名無しさん
        そこは気になるね。でも複数ゲームで評価してるから、ある程度は公平だと思う。

    • #69470 返信
      名無しさん
      個人的にはコード生成ならClaudeやGPT-4oにまだ及ばない印象。でもオープンなのは良い。

      • #69471 返信
        名無しさん
        値段とプライバシーを考えれば十分トレードオフになるよ。API叩き続けるより自分のマシンで動かせる安心感は大きい。

    • #69472 返信
      名無しさん
      このリーグの詳細な結果ってどこかで見れるの?ソースのRedditにリンクある?

      • #69473 返信
        名無しさん
        Redditのポスト自体にリンクが貼ってあったはず。たしかGitHubのリポジトリとかなんとか。

        • #69474 返信
          名無しさん
          ありがとう。後で調べてみる。ローカルLLMの進化は本当に早いね。

16件の返信を表示中(うち親返信7件)
返信先: GLM-5とDeepSeekがゲームエージェントコーディングリーグでトップ6入りで#69462に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました