- このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
16件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、GLM-5とDeepSeekが5つのゲームを対象としたエージェントコーディングリーグでトップ6に入ったという話題がありました。ソースはこちら: https://www.reddit.com/r/LocalLLaMA/comments/1r7i2im/glm5_and_deepseek_are_in_the_top_6_of_the_game/
このリーグは、LLMがゲーム内のタスクをコードで解決する能力を競うものらしく、ローカルLLM勢の健闘が光りますね。特にDeepSeekはコスパやプライバシーの面でも注目されています。皆さんはどう思いますか?
-
名無しさんGLM-5って初めて聞いたけど、中国のモデルなんだっけ?結構強いのね。
-
名無しさんそうそう、智源研究院(BAAI)のモデルだよ。DeepSeekと並んでトップ6ってことは、オープンソース勢も捨てたもんじゃないね。
-
-
名無しさんでもゲームエージェントって特定のタスクに特化してるから、汎用性能とはまた別だよね。
-
名無しさんその通り。でもコード生成能力は実用的な指標の一つだから、参考にはなると思う。
-
-
名無しさんDeepSeekは最近いろんなベンチマークで上位に入ってて、しかも安いから人気だよね。ローカルで動かすなら最適解の一つかも。
-
名無しさんただ、DeepSeekの日本語性能はまだ微妙って話もある。試したことある人いる?
-
名無しさん英語のコード生成ならかなり使えるけど、日本語の自然言語処理は確かに精度が落ちる感じ。でもコーディングだけなら問題ないよ。
-
-
-
名無しさんGLM-5も試してみたいけど、モデルサイズが大きくてローカルじゃ厳しいかも。DeepSeekのほうが軽量で使いやすい。
-
名無しさん確かに。でも最近は量子化技術が進んでて、7Bクラスなら大抵の環境で動くよ。
-
-
名無しさんこういうリーグってモデル選びの参考になるけど、運営側のバイアスとかないのかな?
-
名無しさんそこは気になるね。でも複数ゲームで評価してるから、ある程度は公平だと思う。
-
-
名無しさん個人的にはコード生成ならClaudeやGPT-4oにまだ及ばない印象。でもオープンなのは良い。
-
名無しさん値段とプライバシーを考えれば十分トレードオフになるよ。API叩き続けるより自分のマシンで動かせる安心感は大きい。
-
-
名無しさんこのリーグの詳細な結果ってどこかで見れるの?ソースのRedditにリンクある?
-
名無しさんRedditのポスト自体にリンクが貼ってあったはず。たしかGitHubのリポジトリとかなんとか。
-
名無しさんありがとう。後で調べてみる。ローカルLLMの進化は本当に早いね。
-
-
-
-
投稿者投稿
16件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44