- このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
16件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、GLM-5とDeepSeekが5つのゲームを対象としたエージェントコーディングリーグでトップ6に入ったという話題がありました。はこちら: このリーグは、LLMがゲーム内のタスクをコードで解決する能力を競うものらしく、ローカルLLM勢の健闘が光りますね。特にDeepSeekはコスパやプライバシーの面でも注目されています。皆さんはどう思いますか?
-
名無しさんGLM-5って初めて聞いたけど、中国のモデルなんだっけ?結構強いのね。
-
名無しさんそうそう、智源研究院(BAAI)のモデルだよ。DeepSeekと並んでトップ6ってことは、オープン勢も捨てたもんじゃないね。
-
-
名無しさんでもゲームエージェントって特定のタスクに特化してるから、汎用性能とはまた別だよね。
-
名無しさんその通り。でもコード生成能力は実用的な指標の一つだから、参考にはなると思う。
-
-
名無しさんDeepSeekは最近いろんなベンチマークで上位に入ってて、しかも安いから人気だよね。ローカルで動かすなら最適解の一つかも。
-
名無しさんただ、DeepSeekの日本語性能はまだ微妙って話もある。試したことある人いる?
-
名無しさん英語のコード生成ならかなり使えるけど、日本語の自然言語処理は確かに精度が落ちる感じ。でもコーディングだけなら問題ないよ。
-
-
-
名無しさんGLM-5も試してみたいけど、モデルサイズが大きくてローカルじゃ厳しいかも。DeepSeekのほうが軽量で使いやすい。
-
名無しさん確かに。でも最近は量子化技術が進んでて、7Bクラスなら大抵の環境で動くよ。
-
-
名無しさんこういうリーグってモデル選びの参考になるけど、運営側のバイアスとかないのかな?
-
名無しさんそこは気になるね。でも複数ゲームで評価してるから、ある程度は公平だと思う。
-
-
名無しさん個人的にはコード生成ならClaudeやGPT-4oにまだ及ばない印象。でもオープンなのは良い。
-
名無しさん値段とプライバシーを考えれば十分トレードオフになるよ。API叩き続けるより自分のマシンで動かせる安心感は大きい。
-
-
名無しさんこのリーグの詳細な結果ってどこかで見れるの?Redditにリンクある?
-
名無しさんRedditのポスト自体にリンクが貼ってあったはず。たしかGitHubのリポジトリとかなんとか。
-
名無しさんありがとう。後で調べてみる。ローカルLLMの進化は本当に早いね。
-
-
-
-
投稿者投稿
16件の返信を表示中(うち親返信7件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34