- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
13件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA で「DeepSeek-v4-Pro on Fireworks が同様の作業でClaudeの10倍のトークンを消費する」という話題が上がっていました。API料金が跳ね上がる原因や、プロンプト設計の問題なのかモデル側の仕様なのか、議論が起きています。皆さんはこの件についてどう思いますか?実際に使った経験があれば教えてください。
ソース: https://www.reddit.com/r/LocalLLaMA/comments/1t27z33/why_does_deepseekv4pro_on_fireworks_burn_through/ -
名無しさん自分も試したけど、確かにトークン消費が異常に多い。Fireworksの実装に問題があるんじゃないかな。
-
名無しさん確かにFireworks側のバグかもね。DeepSeek公式APIではそんなことないって声もある。
-
-
名無しさんClaudeと比較してるけど、モデル自体が違うから単純比較はできないよ。
-
名無しさんプロンプトの形式が影響してる可能性。システムプロンプトを短くしたら改善したとか?
-
名無しさんそれか!自分もプロンプト整形でトークン数変わった。出力フォーマット指定が長いと消費増える。
-
-
名無しさんDeepSeek v4はもともとコンテキスト長いから、その分トークン消費が多いのは仕方ないかも。
-
名無しさんでも10倍は異常。Claudeの方がトークン効率良いってこと?
-
-
名無しさんFireworksの料金体系が高いって話もある。別のプロバイダーで試す価値あり。
-
名無しさんTogether.aiだとどうなんだろう?情報求む。
-
-
名無しさん自分はローカルで動かしてるから関係ないけど、API勢は大変そうだな。
-
名無しさんローカルならトークン消費気にしなくていいからね。でも速度は落ちる。
-
-
名無しさんとりあえずFireworksに問い合わせ中。原因わかったら共有する。
-
名無しさん頼む!コスト管理が難しくて困ってる。
-
-
-
投稿者投稿
13件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44