- このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
24件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek V4 Pro Maxのベンチマーク結果が話題になっていました。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1su3lsz/deepseek_v4_pro_max_benchmarks_vs_frontier_models/ 主な論点は、コード生成や推論性能がGPT-4oやClaude 3.5 Sonnetに匹敵するか、ローカル実行時のコストとプライバシーのバランス、そして実際に使ったユーザーの声です。皆さんはどう評価しますか?
-
名無しさんとりあえずベンチマークだけ見ると凄いけど、実際使ってみると微妙ってパターンが多いからなあ。
-
名無しさんそうそう、ベンチマークの条件次第で結果変わるからね。特に日本語タスクだとまた違うかもしれない。
-
名無しさんでもDeepSeekは前からローカルLLMの中では良い方だと思う。V3も結構使えたし。
-
-
名無しさんコード生成でGPT-4oに勝ったってデータあるけど、自分のユースケースだとそんなに差感じない。
-
名無しさんローカルで動かせるってのが一番の魅力。API代かからないし、プライバシーも安心。
-
名無しさんPro Maxって名前がなんか怪しい。本当にProなの?Maxなの?
-
名無しさん他のフロンティアモデルと比べると、やっぱりマルチモーダルが弱いんじゃない?
-
名無しさんそこは確かに。テキスト特化ならいいけど、画像理解はまだまだ。
-
名無しさんでも最近のバージョンで画像入力に対応したって聞いたよ。試した人いる?
-
名無しさん試したけど、精度はGPT-4oには及ばない。でもローカルで動くのはでかい。
-
-
-
名無しさんRedditのコメント見てると、結構コストパフォーマンスを評価してる人が多いね。
-
名無しさんうん、API叩きまくるよりはローカルで動かせる方が長期的には安いし。
-
名無しさんただし、そのために高性能なGPUが必要だから初期投資はかかるけど。
-
-
名無しさん個人的には、V4のベースモデル無料で公開されたら嬉しいな。
-
名無しさん多分オープンウェイトになるんじゃない?DeepSeekは割とオープンな方だし。
-
-
名無しさん中国製ってのが気になる人もいるみたいだけど、そこはどうでもいいかな。
-
名無しさんまあそういう意見もあるけど、技術的には優秀だから使うのはあり。
-
-
名無しさんベンチマークの数字だけ見ると、GPT-4o超えてる項目もあるんだよね。すごい。
-
名無しさんでもベンチマークって飽和してきてるから、本当の実力差は感じにくい。
-
-
名無しさん今はClaude 3.5 Sonnetを使ってるけど、乗り換え検討中。
-
名無しさんClaudeもいいけど、DeepSeekの方がコーディング特化って感じがする。
-
名無しさん実際にプロジェクトで使ってみて、どっちが効率的か比べてみたい。
-
-
名無しさんとりあえず早く試せる環境が欲しい。量子化版が待ち遠しい。
-
名無しさん量子化版出たらすぐにでも試すわ。8bitでどのくらい性能落ちるか気になる。
-
-
-
投稿者投稿
24件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44