DeepSeek新モデル、コンテキスト長3.2M?1Mじゃないらしい

掲示板 フォーラム AI DeepSeek新モデル、コンテキスト長3.2M?1Mじゃないらしい

  • このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
26件の返信を表示中(うち親返信13件)
  • 投稿者
    投稿
    • #69361 返信
      名無しさん
      Reddit r/LocalLLaMAで話題のDeepSeek新モデル、当初1Mコンテキストと言われていたけど実は3.2Mかもしれないという投稿がありました。
      ローカルLLMユーザーとしてはコンテキスト長の拡大は嬉しいけど、メモリ消費や速度が気になりますね。皆さんはどう思いますか?

    • #69362 返信
      名無しさん
      3.2Mってすごいな。でもローカルだとGPUメモリが足りなさそう。

      • #69364 返信
        名無しさん
        今の4090でも24GBじゃ厳しいだろうね。量子化すればいけるか?

    • #69363 返信
      名無しさん
      本当ならコード補完に使いたい。長いプロジェクト全体を入れられるかも。

    • #69365 返信
      名無しさん
      DeepSeekは中国のモデルだから、やっぱりデータ収集が気になる。

      • #69366 返信
        名無しさん
        ローカルで動かせば問題ないでしょ。オープンソースだし。

    • #69367 返信
      名無しさん
      Redditではベンチマーク結果が賛否両論だったな。実際の性能はどうなんだろう。

      • #69368 返信
        名無しさん
        リーダーボードでは上位だけど、実用的なタスクだと微妙って声もあるよ。

    • #69369 返信
      名無しさん
      コンテキスト長だけじゃなくて、推論コストも下がってるといいな。

      • #69370 返信
        名無しさん
        確かに。APIの価格次第では業務でも使える。

    • #69371 返信
      名無しさん
      3.2Mって検索拡張(RAG)いらなくなるレベルじゃない?

      • #69372 返信
        名無しさん
        いや、それでも検索は必要だよ。全部の情報をコンテキストに入れるのは非効率。

    • #69373 返信
      名無しさん
      これってDeepSeek-V3の後継?それとも別物?

      • #69374 返信
        名無しさん
        おそらくR1系統の派生モデルじゃないかな。詳細まだ不明。

    • #69375 返信
      名無しさん
      とにかくベンチマークの数字だけじゃなくて、自分の使い方で試したい。

      • #69376 返信
        名無しさん
        Ollamaで早く動かせるようにならないかな。

    • #69377 返信
      名無しさん
      contextの長さだけで優劣決めるのは危険。精度が落ちるかもしれない。

      • #69378 返信
        名無しさん
        その通り。長ければいいってもんじゃない。Lost in the middle問題は解決されてるの?

        • #69379 返信
          名無しさん
          そこが一番気になる。論文ではどうなってるんだろう。

    • #69380 返信
      名無しさん
      中国の規制に引っかからなければいいけど。

      • #69381 返信
        名無しさん
        オープンソースだからこそ、自分でチェックできる。

    • #69382 返信
      名無しさん
      しかし3.2Mって聞くと、Llama 3.1 405Bの128Kが小さく感じるな。

      • #69383 返信
        名無しさん
        でも405Bはパラメータ数が桁違い。コンテキスト長だけ比較してもね。

    • #69384 返信
      名無しさん
      個人的には1Mでも十分すぎる。3.2Mって誰が使うんだ?

      • #69385 返信
        名無しさん
        コード生成や法律文書分析には役立つかも。

    • #69386 返信
      名無しさん
      とにかく実際にリリースされてから評価しよう。今は噂段階だし。

      • #69387 返信
        名無しさん
        楽しみだけど、過度な期待は禁物だね。

26件の返信を表示中(うち親返信13件)
返信先: DeepSeek新モデル、コンテキスト長3.2M?1Mじゃないらしいで#69368に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました