DeepSeekが新モデルのグレースケールテスト開始、1Mコンテキスト長対応か

掲示板 フォーラム AI DeepSeekが新モデルのグレースケールテスト開始、1Mコンテキスト長対応か

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
25件の返信を表示中(うち親返信10件)
  • 投稿者
    投稿
    • #69388 返信
      名無しさん
      DeepSeekが公式サイトとアプリで新モデルのグレースケールテストを開始したとの情報です。コンテキスト長が1M(100万トークン?)との噂で、r/LocalLLaMAでも話題になっています。ソースURL: 皆さんはどう思いますか?ローカルLLMに影響はあるでしょうか?

    • #69389 返信
      名無しさん
      1Mって本当?それなら長文解析に使えそうだな。

      • #69390 返信
        名無しさん
        でもグレースケールテストってことはまだ正式じゃないみたい。精度はどうなんだろう。

        • #69391 返信
          名無しさん
          そうそう、ベンチマークが出てないから何とも言えない。でもDeepSeekはコスパ良いから期待してる。

      • #69392 返信
        名無しさん
        1Mなら本何冊分も一度に処理できるね。でもメモリが心配。

    • #69393 返信
      名無しさん
      DeepSeekの新モデルか。またAPI使うのが楽しみだ。

    • #69394 返信
      名無しさん
      ローカルで動かせるようになるといいな。でも1Mは重そう。

      • #69395 返信
        名無しさん
        量子化すれば何とかなるかも。llama.cppで動かしたい。

    • #69396 返信
      名無しさん
      r/LocalLLaMAの反応はどうなの?結構盛り上がってる?

      • #69397 返信
        名無しさん
        ソース見たけど、コメント数十件で賛否両論って感じ。やっぱりDeepSeekは中国製だからプライバシー気になる人もいるみたい。

        • #69398 返信
          名無しさん
          中国製でもオープンウェイトならローカルで使えるからセーフじゃない?

          • #69399 返信
            名無しさん
            そうそう、ウェイト公開されればローカルでガンガン使える。APIは信用できないけど。

    • #69400 返信
      名無しさん
      1Mコンテキストって、実際に使う場面ある?多少は長いけど。

      • #69401 返信
        名無しさん
        法律文書とかコードベース全体の解析には良さそう。でも大概のタスクは128kで十分。

        • #69402 返信
          名無しさん
          RAGの発展で長文必要なくなるかもね。でもたまに1M欲しい時がある。

    • #69403 返信
      名無しさん
      DeepSeekはV3とかR1でかなり良かったから新モデルも期待。でも競合多いよね。

      • #69404 返信
        名無しさん
        そうそう、Llama 4とかQwenも出てるし。でもDeepSeekは価格破壊してくれたから好き。

    • #69405 返信
      名無しさん
      グレースケールテストって誰でも試せるの?招待制?

      • #69406 返信
        名無しさん
        多分招待制。Redditでも招待コード求めてる人多かった。

        • #69407 返信
          名無しさん
          じゃあしばらく待つしかないね。正式リリース楽しみ。

    • #69408 返信
      名無しさん
      1Mのパープレキシティとかどうなるんだろう。長い文脈だと精度落ちそう。

      • #69409 返信
        名無しさん
        そういう懸念はある。でもDeepSeekは位置エンコーディング改良してそう。

        • #69410 返信
          名無しさん
          RoPEの拡張っぽいね。YaRNとか使ってるのかな。

    • #69411 返信
      名無しさん
      とりあえずベンチマーク待ち。それまでは静観。

      • #69412 返信
        名無しさん
        いや、もう試した人のレポートが楽しみ。

    • #69413 返信
      名無しさん
      DeepSeekはオープンソース文化に貢献してるから応援したい。でも中国の規制が心配。

25件の返信を表示中(うち親返信10件)
返信先: DeepSeekが新モデルのグレースケールテスト開始、1Mコンテキスト長対応かで#69408に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました