DeepSeek V4 Pro Maxのベンチマーク、フロンティアモデルと比較してどう思う?

掲示板 フォーラム AI DeepSeek V4 Pro Maxのベンチマーク、フロンティアモデルと比較してどう思う?

  • このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
24件の返信を表示中(うち親返信11件)
  • 投稿者
    投稿
    • #65093 返信
      名無しさん
      Redditのr/LocalLLaMAでDeepSeek V4 Pro Maxのベンチマーク結果が話題になっていました。URL: 主な論点は、コード生成や推論性能がGPT-4oやClaude 3.5 Sonnetに匹敵するか、ローカル実行時のコストとプライバシーのバランス、そして実際に使ったユーザーの声です。皆さんはどう評価しますか?

    • #65094 返信
      名無しさん
      とりあえずベンチマークだけ見ると凄いけど、実際使ってみると微妙ってパターンが多いからなあ。

      • #65097 返信
        名無しさん
        そうそう、ベンチマークの条件次第で結果変わるからね。特に日本語タスクだとまた違うかもしれない。

      • #65098 返信
        名無しさん
        でもDeepSeekは前からローカルLLMの中では良い方だと思う。V3も結構使えたし。

    • #65095 返信
      名無しさん
      コード生成でGPT-4oに勝ったってデータあるけど、自分のユースケースだとそんなに差感じない。

    • #65096 返信
      名無しさん
      ローカルで動かせるってのが一番の魅力。API代かからないし、プライバシーも安心。

    • #65099 返信
      名無しさん
      Pro Maxって名前がなんか怪しい。本当にProなの?Maxなの?

    • #65100 返信
      名無しさん
      他のフロンティアモデルと比べると、やっぱりマルチモーダルが弱いんじゃない?

      • #65101 返信
        名無しさん
        そこは確かに。テキスト特化ならいいけど、画像理解はまだまだ。

      • #65102 返信
        名無しさん
        でも最近のバージョンで画像入力に対応したって聞いたよ。試した人いる?

        • #65103 返信
          名無しさん
          試したけど、精度はGPT-4oには及ばない。でもローカルで動くのはでかい。

    • #65104 返信
      名無しさん
      Redditのコメント見てると、結構コストパフォーマンスを評価してる人が多いね。

      • #65105 返信
        名無しさん
        うん、API叩きまくるよりはローカルで動かせる方が長期的には安いし。

      • #65106 返信
        名無しさん
        ただし、そのために高性能なGPUが必要だから初期投資はかかるけど。

    • #65107 返信
      名無しさん
      個人的には、V4のベースモデル無料で公開されたら嬉しいな。

      • #65108 返信
        名無しさん
        多分オープンウェイトになるんじゃない?DeepSeekは割とオープンな方だし。

    • #65109 返信
      名無しさん
      中国製ってのが気になる人もいるみたいだけど、そこはどうでもいいかな。

      • #65110 返信
        名無しさん
        まあそういう意見もあるけど、技術的には優秀だから使うのはあり。

    • #65111 返信
      名無しさん
      ベンチマークの数字だけ見ると、GPT-4o超えてる項目もあるんだよね。すごい。

      • #65112 返信
        名無しさん
        でもベンチマークって飽和してきてるから、本当の実力差は感じにくい。

    • #65113 返信
      名無しさん
      今はClaude 3.5 Sonnetを使ってるけど、乗り換え検討中。

      • #65114 返信
        名無しさん
        Claudeもいいけど、DeepSeekの方がコーディング特化って感じがする。

      • #65115 返信
        名無しさん
        実際にプロジェクトで使ってみて、どっちが効率的か比べてみたい。

    • #65116 返信
      名無しさん
      とりあえず早く試せる環境が欲しい。量子化版が待ち遠しい。

      • #65117 返信
        名無しさん
        量子化版出たらすぐにでも試すわ。8bitでどのくらい性能落ちるか気になる。

24件の返信を表示中(うち親返信11件)
返信先: DeepSeek V4 Pro Maxのベンチマーク、フロンティアモデルと比較してどう思う?で#65104に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました