DeepSeekの新モデル、なぜこんなに遅れているのか?

掲示板 フォーラム AI DeepSeekの新モデル、なぜこんなに遅れているのか?

  • このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
19件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • 名無しさん
      DeepSeekが新しいモデルをなかなかリリースしない件について、Redditのr/LocalLLaMAで議論が行われていました。、前モデルからかなり時間が経っているのに、なぜ音沙汰がないのか、という疑問が中心です。コメント欄では「品質を上げるために時間をかけている」「競合が増えて戦略を見直しているのでは」「中国の規制が影響している可能性」といった意見や、「実際V3/R1はまだ現役で使えるから急ぐ必要ない」という声も。一方で「ClaudeやGPT-4oに追い越されて焦っているのでは?」という皮肉も。

    • 名無しさん
      確かにV3からもう結構経つよな。次のモデルは何を出してくるんだろう。

    • 名無しさん
      R1がまだ強いから別に急がなくてもいい気もする。むしろ焦って質落とすよりマシ。

      • 名無しさん
        それな。でも競合のClaudeやGeminiがどんどん性能上げてきてるから、あんまり悠長にしてられないんじゃない?

        • 名無しさん
          でもDeepSeekはオープンウェイトでコスパ良いから、その点はまだアドバンテージあるよね。

    • 名無しさん
      中国の輸出規制とか影響してる可能性もあるって書いてた人いたけど、実際どうなんだろ?

      • 名無しさん
        あれは半導体関連の話で、モデル開発自体には直接関係ないんじゃないかな。

        • 名無しさん
          でもトレーニングに使うAIチップの調達に影響出るから、間接的にはあるかもね。

    • 名無しさん
      個人的にはDeepSeekはコーディング特化のモデル出してほしい。R1は汎用に振りすぎ。

      • 名無しさん
        確かにCodeLlamaとかよりR1のコード性能は良いと思うけど、もっと尖っててもいいよね。

        • 名無しさん
          でも最近QwenのCodeモデルが結構いいらしいよ。DeepSeekが遅れてる間にライバルが増えてる。

    • 名無しさん
      Redditのコメント見てると「DeepSeekはもう終わった」って言う人もいて草。さすがに極端すぎるわ。

      • 名無しさん
        いや、でもリリース間隔が空きすぎるとコミュニティの熱が冷めるのは事実。自分もV3使わなくなったし。

        • 名無しさん
          まあOSSモデルは選択肢多いから、一社にこだわる必要もないけどね。

    • 名無しさん
      次のモデルがもしV4なら、R1の反省を活かしたマルチモーダル対応とか来るんじゃない?

      • 名無しさん
        マルチモーダルはいいけど、それよりまずメモリ効率改善とかしてほしい。

        • 名無しさん
          そうそう、R1はメモリ食いすぎ。ローカルで動かすには厳しい。

    • 名無しさん
      DeepSeekの開発チームは中国の研究機関が主体だから、政治的なプレッシャーもあるのかもね。

      • 名無しさん
        そういう意味ではオープンなコミュニティとの協業が難しいのかもしれない。

        • 名無しさん
          ともかく、静かにしていいものが出てくるのを待つのが一番だよ。焦っても仕方ない。

19件の返信を表示中(うち親返信7件)
返信先: DeepSeekの新モデル、なぜこんなに遅れているのか?で#65241に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました