DeepSeek V4登場!1Mコンテクスト、二つのモデルサイズ、コーディング性能でオープン最強を主張

掲示板 フォーラム AI DeepSeek V4登場!1Mコンテクスト、二つのモデルサイズ、コーディング性能でオープン最強を主張

  • このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
21件の返信を表示中(うち親返信11件)
  • 投稿者
    投稿
    • #65911 返信
      名無しさん
      Redditのr/LocalLLaMAでDeepSeek V4のリリースが話題になっています。最大1Mトークンのコンテクストと二つのモデルサイズ(おそらく7Bと67B?)があり、コーディングベンチマークでオープン最強を謳っているそうです。ローカルLLMコミュニティでは、実際の性能やVRAM要件、ライセンス、既存モデルとの比較などが議論されています。

    • #65912 返信
      名無しさん
      1Mコンテクストはすごいね。でもVRAMどれくらい食うんだろう?

      • #65913 返信
        名無しさん
        多分7B版で48GBあればいけるんじゃない?量子化次第だけど。

    • #65914 返信
      名無しさん
      コーディング性能が最強って言われても、何のベンチマークでもそうなのか気になる。

      • #65915 返信
        名無しさん
        HumanEvalとかLiveCodeBenchかな?DeepSeekは前からCoder特化強いし。

    • #65916 返信
      名無しさん
      これQwen2.5との比較はどうなんだろ。実際使ってみないとわからん。

    • #65917 返信
      名無しさん
      1Mコンテクストってもう全コードベースを一度に読み込めるレベルだな。

      • #65918 返信
        名無しさん
        でも推論がめっちゃ遅くなりそう。トレードオフだね。

    • #65919 返信
      名無しさん
      オープンと言ってもライセンスは確認したほうがいい。DeepSeekは商用利用OKだったっけ?

      • #65920 返信
        名無しさん
        たしかMITライセンスだった気がするけど、今はどうだか。

    • #65921 返信
      名無しさん
      自分で動かすのは厳しいからAPI使うけど、API価格はどうなるんだろう。

      • #65922 返信
        名無しさん
        前のバージョンより安くなってるといいな。

    • #65923 返信
      名無しさん
      ローカルで動かすならDPOでファインチューニングできるのかな?

      • #65924 返信
        名無しさん
        多分できると思うけど、1Mコンテクストだと学習も大変そう。

    • #65925 返信
      名無しさん
      ベンチマークだけじゃなくて実際のコーディング支援で使ってみたい。

      • #65926 返信
        名無しさん
        発言と違って実際は微妙だったってパターンもあるからな。

    • #65927 返信
      名無しさん
      HuggingFaceにモデル重りもう上がってる?まだかも。

      • #65928 返信
        名無しさん
        さっき見たけどまだ公開されてなかった。数日中には出るんじゃない?

    • #65929 返信
      名無しさん
      llama.cppで動かせるようになってほしい。

      • #65930 返信
        名無しさん
        gguf変換すればいけるんじゃね?たぶんすぐ対応されるよ。

    • #65931 返信
      名無しさん
      こういう新モデルが出るたびにワクワクするけど、実用性は時間が経たないとわからない。

      • #65932 返信
        名無しさん
        そうそう。とりあえずベンチマーク結果眺めてニヤニヤしてる。

21件の返信を表示中(うち親返信11件)
返信先: DeepSeek V4登場!1Mコンテクスト、二つのモデルサイズ、コーディング性能でオープン最強を主張で#65917に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました