DeepSeek V4の100万コンテキストウィンドウ:限界点か?

掲示板 フォーラム AI DeepSeek V4の100万コンテキストウィンドウ:限界点か?

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
25件の返信を表示中(うち親返信12件)
  • 投稿者
    投稿
    • #62330 返信
      名無しさん
      DeepSeek V4が100万トークンのコンテキストをサポートしたという話題がRedditで盛り上がっています。実際にローカルで動かすにはメモリが何TB必要になるのか、コスト面ではどうか、また100万トークンも使うユースケースがあるのかなど、様々な意見が飛び交っています。URL:

    • #62331 返信
      名無しさん
      100万トークンって実際どれくらいの文章量なんだろう?

      • #62332 返信
        名無しさん
        ざっくり言うと『ハリー・ポッター』シリーズ全巻分くらいらしい。

    • #62333 返信
      名無しさん
      そんな長いコンテキスト、誰が使うんだよ。

      • #62335 返信
        名無しさん
        でもメモリ消費がやばそう。GPUメモリ64GBじゃ足りないと思う。

    • #62334 返信
      名無しさん
      コードベース全体を読ませるとか、長編小説の解析とか?

    • #62336 返信
      名無しさん
      DeepSeek V4ってオープンなの?

      • #62337 返信
        名無しさん
        多分オープンウェイトだけど、そんな大規模モデルを動かせる環境は限られるよ。

    • #62338 返信
      名無しさん
      ベンチマークでMQAとかでどれだけ差が出るのか気になる。

      • #62339 返信
        名無しさん
        100万トークンクラスのベンチマークってまだ少ないし、過学習してる可能性も。

    • #62340 返信
      名無しさん
      個人的にはローカルで動かせないと意味ないと思う。

      • #62341 返信
        名無しさん
        クラウドAPIでもいいけど、レイテンシとコストがなあ。

        • #62342 返信
          名無しさん
          100万トークンの推論APIって1回数千円とかじゃない?

    • #62343 返信
      名無しさん
      だからこそ蒸留モデルとか小規模版に期待したい。

    • #62344 返信
      名無しさん
      しかし、Attentionの計算量O(L^2)が現実的にどうなるか。Linear Attentionとか使ってるのかな。

      • #62345 返信
        名無しさん
        多分何かしらの近似手法は入ってると思う。

    • #62346 返信
      名無しさん
      実際の使われ方としては、まるごと法律文書とか契約書を突っ込む用途かな。

      • #62347 返信
        名無しさん
        でも精度が落ちたら意味ないし、検証が大変そう。

    • #62348 返信
      名無しさん
      Redditのスレでは「メモリ使用量がバカにならない」って意見が多かった。

      • #62349 返信
        名無しさん
        実際、100万トークンで推論するにはH100 8枚でもきついとか。

        • #62350 返信
          名無しさん
          じゃあ現実的には研究用途オンリーだな。

    • #62351 返信
      名無しさん
      DeepSeekは中国の会社だし、データのプライバシー面でも懸念。

      • #62352 返信
        名無しさん
        ローカルで動かすなら関係ないけど、APIはちょっと使いたくない。

        • #62353 返信
          名無しさん
          まあ、とにかく興味深い技術ではある。

    • #62354 返信
      名無しさん
      100万コンテキストが標準になるのはまだまだ先だと思う。

      • #62355 返信
        名無しさん
        それでも技術の進歩はすごいね。数年後には当たり前になってたりして。

25件の返信を表示中(うち親返信12件)
返信先: DeepSeek V4の100万コンテキストウィンドウ:限界点か?で#62335に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました