- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
19件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんDeepSeekが新しいモデルをなかなかリリースしない件について、Redditのr/LocalLLaMAで議論が行われていました。元スレでは、前モデルからかなり時間が経っているのに、なぜ音沙汰がないのか、という疑問が中心です。コメント欄では「品質を上げるために時間をかけている」「競合が増えて戦略を見直しているのでは」「中国の規制が影響している可能性」といった意見や、「実際V3/R1はまだ現役で使えるから急ぐ必要ない」という声も。一方で「ClaudeやGPT-4oに追い越されて焦っているのでは?」という皮肉も。
-
名無しさん確かにV3からもう結構経つよな。次のモデルは何を出してくるんだろう。
-
名無しさんR1がまだ強いから別に急がなくてもいい気もする。むしろ焦って質落とすよりマシ。
-
名無しさんそれな。でも競合のClaudeやGeminiがどんどん性能上げてきてるから、あんまり悠長にしてられないんじゃない?
-
名無しさんでもDeepSeekはオープンウェイトでコスパ良いから、その点はまだアドバンテージあるよね。
-
-
-
名無しさん中国の輸出規制とか影響してる可能性もあるって書いてた人いたけど、実際どうなんだろ?
-
名無しさんあれは半導体関連の話で、モデル開発自体には直接関係ないんじゃないかな。
-
名無しさんでもトレーニングに使うAIチップの調達に影響出るから、間接的にはあるかもね。
-
-
-
名無しさん個人的にはDeepSeekはコーディング特化のモデル出してほしい。R1は汎用に振りすぎ。
-
名無しさん確かにCodeLlamaとかよりR1のコード性能は良いと思うけど、もっと尖っててもいいよね。
-
名無しさんでも最近QwenのCodeモデルが結構いいらしいよ。DeepSeekが遅れてる間にライバルが増えてる。
-
-
-
名無しさんRedditのコメント見てると「DeepSeekはもう終わった」って言う人もいて草。さすがに極端すぎるわ。
-
名無しさんいや、でもリリース間隔が空きすぎるとコミュニティの熱が冷めるのは事実。自分もV3使わなくなったし。
-
名無しさんまあOSSモデルは選択肢多いから、一社にこだわる必要もないけどね。
-
-
-
名無しさん次のモデルがもしV4なら、R1の反省を活かしたマルチモーダル対応とか来るんじゃない?
-
名無しさんマルチモーダルはいいけど、それよりまずメモリ効率改善とかしてほしい。
-
名無しさんそうそう、R1はメモリ食いすぎ。ローカルで動かすには厳しい。
-
-
-
名無しさんDeepSeekの開発チームは中国の研究機関が主体だから、政治的なプレッシャーもあるのかもね。
-
名無しさんそういう意味ではオープンなコミュニティとの協業が難しいのかもしれない。
-
名無しさんともかく、静かにしていいものが出てくるのを待つのが一番だよ。焦っても仕方ない。
-
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44