- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
20件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんスレッド「Why-l does deepseek-v4-pro on Fireworks burn through tokens 10× faster than Claude for similar work?」から。Fireworks上のDeepSeek v4 proが、同じタスクでClaudeより10倍トークンを消費するという報告。実際に使った人の体験や原因について議論が行われている。
-
名無しさんこれ本当?自分も試してみたけど確かにトークン消費がエグい。Claudeだと500トークンで済む文章が5000トークン行く。
-
名無しさんDeepSeekはシステムプロンプトを無視してユーザープロンプトに全部詰め込んでるんじゃない?APIの仕様でそうなってるとか。
-
-
名無しさんFireworks側の設定じゃない?max_tokensとかtemperatureの問題かも。
-
名無しさんいや、設定は同じにしてる。特にプロンプトのフォーマットが違うって話もあるけど、それだけじゃ説明できない差。
-
-
名無しさんでも性能は良いよね。コーディングとかはClaudeより正確な気がする。トークン消費が増えるのはトレードオフか。
-
名無しさん性能良いけど金銭的にキツいわ。Claudeの1/10の価格だと逆転するけど、現状は高い。
-
名無しさんローカルで動かせばトークン消費気にしなくていいんじゃない?DeepSeekはVulkan対応だし。
-
名無しさんローカルはメモリ足りない。V4は70Bクラスでしょ?普通のGPUじゃ無理。
-
-
-
-
名無しさんFireworksのAPI特有のバグとか?他のプロバイダーで試した人いる?
-
名無しさんTogether AIでも似たような報告あった。DeepSeekのトークナイザーが原因かもしれない。
-
名無しさんトークナイザーの違いか。Claudeはサブワード、DeepSeekはBPE?確かに無駄に分割してそう。
-
-
-
名無しさんとりあえず使用量に注意が必要だな。プロダクションで使うならよくテストしないと。
-
名無しさんそもそもこういう情報、公式から出てないのが問題。ユーザーが泣きを見る。
-
名無しさんDeepSeekのドキュメント、まともなのないしね。中国製だから仕方ないのか。
-
-
-
名無しさんClaudeの方がコスパいいわ。DeepSeekはベンチマークだけだと見えない欠点がある。
-
名無しさんでも特定のタスク(例:コード生成)ではDeepSeekの方が出力が細かい。トークン多くても品質が高いなら許容範囲かと。
-
名無しさん品質高いって言っても、Claudeと比べて有意差あるか?個人的には誤差レベル。
-
-
-
名無しさんAPIのレスポンス時間も気になる。トークン消費多いとレイテンシも上がるよね。
-
名無しさん実際使ってみたけど、体感で2倍くらい遅い。その点Claudeは速い。
-
名無しさんうーん、じゃあ今はClaudeでいいか。DeepSeek v5に期待しよう。
-
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信7件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56