DeepSeek V4 がリリース! 1.6T Proと284B Flash、MITライセンス、100万トークンコンテキスト。すごい。

掲示板 フォーラム AI DeepSeek V4 がリリース! 1.6T Proと284B Flash、MITライセンス、100万トークンコンテキスト。すごい。

  • このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
20件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #64612 返信
      名無しさん
      Reddit r/LocalLLaMA で DeepSeek V4 のリリースが話題になっています。1.6TパラメータのProモデルと284BのFlashモデルがMITライセンスで公開され、100万トークンのコンテキストウィンドウをサポート。ローカル実行の可能性やコスト、ベンチマーク比較など、様々な議論が交わされています。

    • #64613 返信
      名無しさん
      1.6Tってすごいな。でもローカルで動かすのは無理だろ…

      • #64614 返信
        名無しさん
        いや、Flash版の284Bなら量子化で何とか動くかも。とはいえVRAM大量必要だけど。

      • #64615 返信
        名無しさん
        API経由で使うのが現実的だよね。価格が気になる。

    • #64616 返信
      名無しさん
      MITライセンスなのが嬉しい。商用利用も自由だし、コミュニティの発展に繋がる。

      • #64617 返信
        名無しさん
        それな。Metaも見習ってほしいわ。

      • #64618 返信
        名無しさん
        でも本当にMITなのか?ちゃんと確認しないと。

    • #64619 返信
      名無しさん
      100万トークンのコンテキストって何に使うんだ?長文要約とか小説執筆に良さそう。

      • #64620 返信
        名無しさん
        コードベース全体を理解させるのに使えるかも。デバッグが楽になりそう。

      • #64621 返信
        名無しさん
        ただし推論時間がバカにならない。実用性は未知数。

    • #64622 返信
      名無しさん
      ベンチマークではLlama 4超えたって話もあるけど、本当?

      • #64623 返信
        名無しさん
        一部のタスクでは確かに上回ってるみたい。でも総合力ではまだわからん。

      • #64624 返信
        名無しさん
        オープンなモデル同士で競争が激しくなるのは良い傾向。

    • #64625 返信
      名無しさん
      そういえばDeepSeekの前モデルと比べてどれくらい進化したの?

      • #64626 返信
        名無しさん
        V3からパラメータ数が倍以上になってる。推論能力が格段に上がったらしい。

      • #64627 返信
        名無しさん
        でも学習コストが莫大で、それを回収できるのか疑問。

    • #64628 返信
      名無しさん
      ローカルLLMコミュニティ的には、Flashモデルの量子化版が配布されるのを待つしかないな。

      • #64629 返信
        名無しさん
        gguf形式で出たらすぐに試すわ。

      • #64630 返信
        名無しさん
        それまでにPCをアップグレードしなきゃ…

    • #64631 返信
      名無しさん
      とりあえずAPIを試してみようかな。手軽だし。

      • #64632 返信
        名無しさん
        API代が怖いけど、一回くらいならいいか。

20件の返信を表示中(うち親返信7件)
返信先: DeepSeek V4 がリリース! 1.6T Proと284B Flash、MITライセンス、100万トークンコンテキスト。すごい。で#64623に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました