DeepSeek V4の検証結果、実際どうなの?

掲示板 フォーラム AI DeepSeek V4の検証結果、実際どうなの?

  • このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
17件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #66544 返信
      名無しさん
      「DeepSeek V4: We Verified Every Claim. Here’s What’s Real.」というスレが立ってたんだけど、内容が403で見れなかったんだよね。タイトルからすると、DeepSeek V4の性能やコスト、プライバシー、ベンチマーク比較などを検証したらしい。ローカルLLM界隈では結構話題になってるモデルだから、実際どうなのか気になる。とりあえず貼っておく:

    • #66545 返信
      名無しさん
      自分はV4使ってみたけど、確かにコーディング性能はかなり上がってる気がする。前のバージョンよりマトモなコード吐くよ。

    • #66546 返信
      名無しさん
      ベンチマークスコアって結局どのくらいなんだ?特にMMLUとかHumanEvalとか。

      • #66547 返信
        名無しさん
        Redditの具体的な数字出てたっぽいんだけどな。ライセンスも気になるし、誰か詳しい人教えて。

        • #66548 返信
          名無しさん
          ライセンスは前と変わらず商用利用OKっぽいよ。ただコストがやっぱり高いって声もある。

    • #66549 返信
      名無しさん
      プライバシー重視でローカル動かしたい身としては、V4の量子化版がどれくらい使えるか気になる。8ビットで十分?

      • #66550 返信
        名無しさん
        自分の環境(RTX4090)では4ビット量子化で問題なく動いてるよ。速度も悪くない。

      • #66551 返信
        名無しさん
        8ビットならVRAM12GBくらいで動くって話。でもベンチマークと実際の精度は別だから注意な。

    • #66552 返信
      名無しさん
      DeepSeekって本当にAPI経由のほうが安いのか?ローカルで動かすよりトークン単価考えたら…

      • #66553 返信
        名無しさん
        大量に使うならAPIの方が手間なくていいかもね。ただ個人でたまに使う分にはローカルで十分。

    • #66554 返信
      名無しさん
      V3と比べて劇的に良くなったって話は本当なのかな?過大広告じゃないかと疑ってる。

      • #66555 返信
        名無しさん
        自分はV3からV4に変えて体感できる差はあったよ。特に長文の要約が改善した。

      • #66556 返信
        名無しさん
        でもベンチマークでは確かに上がってるけど、実用的なタスクだと差を感じないって意見もあるよね。

    • #66557 返信
      名無しさん
      Hugging Faceに重みが上がってるから試してみるのが一番だと思う。自分はまだ試してないけど、ダウンロード中。

      • #66558 返信
        名無しさん
        重み自体は結構でかいから、回線速度に注意な。自分は途中で切れてやり直した。

    • #66559 返信
      名無しさん
      そういえば中国のモデルだからデータの安全性は大丈夫なの?そこが引っかかる。

      • #66560 返信
        名無しさん
        オープンだしコードは確認できるけど、学習データに何が入ってるかは不明だよね。リスクはある。

      • #66561 返信
        名無しさん
        ローカルで使えば少なくともデータは外部に漏れないから、その点は安心なんじゃない?

17件の返信を表示中(うち親返信7件)
返信先: DeepSeek V4の検証結果、実際どうなの?で#66556に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました