DeepSeek V4 Pro Maxのベンチマーク、フロンティアモデルと比較してどう思う？

名無しさん · 2025-10-26T00:43:13+09:00

Redditのr/LocalLLaMAでDeepSeek V4 Pro Maxのベンチマーク結果が話題になっていました。URL: 主な論点は、コード生成や推論性能がGPT-4oやClaude 3.5 Sonnetに匹敵するか、ローカル実行時のコストとプライバシーのバランス、そして実際に使ったユーザーの声です。皆さんはどう評価しますか？

このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。

24件の返信を表示中（うち親返信11件）

投稿者

投稿
- 2025年10月26日 12:43 AM #65093 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAでDeepSeek V4 Pro Maxのベンチマーク結果が話題になっていました。URL: 主な論点は、コード生成や推論性能がGPT-4oやClaude 3.5 Sonnetに匹敵するか、ローカル実行時のコストとプライバシーのバランス、そして実際に使ったユーザーの声です。皆さんはどう評価しますか？
- 2025年10月26日 12:44 AM #65094 返信
  
  名無しさん
  
  とりあえずベンチマークだけ見ると凄いけど、実際使ってみると微妙ってパターンが多いからなあ。
  - 2025年10月26日 12:59 AM #65097 返信
    
    名無しさん
    
    そうそう、ベンチマークの条件次第で結果変わるからね。特に日本語タスクだとまた違うかもしれない。
  - 2025年10月26日 1:01 AM #65098 返信
    
    名無しさん
    
    でもDeepSeekは前からローカルLLMの中では良い方だと思う。V3も結構使えたし。
- 2025年10月26日 12:47 AM #65095 返信
  
  名無しさん
  
  コード生成でGPT-4oに勝ったってデータあるけど、自分のユースケースだとそんなに差感じない。
- 2025年10月26日 12:52 AM #65096 返信
  
  名無しさん
  
  ローカルで動かせるってのが一番の魅力。API代かからないし、プライバシーも安心。
- 2025年10月26日 1:04 AM #65099 返信
  
  名無しさん
  
  Pro Maxって名前がなんか怪しい。本当にProなの？Maxなの？
- 2025年10月26日 1:10 AM #65100 返信
  
  名無しさん
  
  他のフロンティアモデルと比べると、やっぱりマルチモーダルが弱いんじゃない？
  - 2025年10月26日 1:19 AM #65101 返信
    
    名無しさん
    
    そこは確かに。テキスト特化ならいいけど、画像理解はまだまだ。
  - 2025年10月26日 1:21 AM #65102 返信
    
    名無しさん
    
    でも最近のバージョンで画像入力に対応したって聞いたよ。試した人いる？
    - 2025年10月26日 1:23 AM #65103 返信
      
      名無しさん
      
      試したけど、精度はGPT-4oには及ばない。でもローカルで動くのはでかい。
- 2025年10月26日 1:27 AM #65104 返信
  
  名無しさん
  
  Redditのコメント見てると、結構コストパフォーマンスを評価してる人が多いね。
  - 2025年10月26日 1:34 AM #65105 返信
    
    名無しさん
    
    うん、API叩きまくるよりはローカルで動かせる方が長期的には安いし。
  - 2025年10月26日 1:45 AM #65106 返信
    
    名無しさん
    
    ただし、そのために高性能なGPUが必要だから初期投資はかかるけど。
- 2025年10月26日 1:47 AM #65107 返信
  
  名無しさん
  
  個人的には、V4のベースモデル無料で公開されたら嬉しいな。
  - 2025年10月26日 1:50 AM #65108 返信
    
    名無しさん
    
    多分オープンウェイトになるんじゃない？DeepSeekは割とオープンな方だし。
- 2025年10月26日 1:55 AM #65109 返信
  
  名無しさん
  
  中国製ってのが気になる人もいるみたいだけど、そこはどうでもいいかな。
  - 2025年10月26日 2:02 AM #65110 返信
    
    名無しさん
    
    まあそういう意見もあるけど、技術的には優秀だから使うのはあり。
- 2025年10月26日 2:04 AM #65111 返信
  
  名無しさん
  
  ベンチマークの数字だけ見ると、GPT-4o超えてる項目もあるんだよね。すごい。
  - 2025年10月26日 2:08 AM #65112 返信
    
    名無しさん
    
    でもベンチマークって飽和してきてるから、本当の実力差は感じにくい。
- 2025年10月26日 2:14 AM #65113 返信
  
  名無しさん
  
  今はClaude 3.5 Sonnetを使ってるけど、乗り換え検討中。
  - 2025年10月26日 2:24 AM #65114 返信
    
    名無しさん
    
    Claudeもいいけど、DeepSeekの方がコーディング特化って感じがする。
  - 2025年10月26日 2:25 AM #65115 返信
    
    名無しさん
    
    実際にプロジェクトで使ってみて、どっちが効率的か比べてみたい。
- 2025年10月26日 2:28 AM #65116 返信
  
  名無しさん
  
  とりあえず早く試せる環境が欲しい。量子化版が待ち遠しい。
  - 2025年10月26日 2:32 AM #65117 返信
    
    名無しさん
    
    量子化版出たらすぐにでも試すわ。8bitでどのくらい性能落ちるか気になる。
投稿者

投稿

24件の返信を表示中（うち親返信11件）

返信先: DeepSeek V4 Pro Maxのベンチマーク、フロンティアモデルと比較してどう思う？で#65104に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック