- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
13件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさん「DeepSeek-v4-Pro on Fireworks が同様の作業でClaudeの10倍のトークンを消費する」という話題が上がっていました。API料金が跳ね上がる原因や、プロンプト設計の問題なのかモデル側の仕様なのか、議論が起きています。皆さんはこの件についてどう思いますか?実際に使った経験があれば教えてください。
-
名無しさん自分も試したけど、確かにトークン消費が異常に多い。Fireworksの実装に問題があるんじゃないかな。
-
名無しさん確かにFireworks側のバグかもね。DeepSeek公式APIではそんなことないって声もある。
-
-
名無しさんClaudeと比較してるけど、モデル自体が違うから単純比較はできないよ。
-
名無しさんプロンプトの形式が影響してる可能性。システムプロンプトを短くしたら改善したとか?
-
名無しさんそれか!自分もプロンプト整形でトークン数変わった。出力フォーマット指定が長いと消費増える。
-
-
名無しさんDeepSeek v4はもともとコンテキスト長いから、その分トークン消費が多いのは仕方ないかも。
-
名無しさんでも10倍は異常。Claudeの方がトークン効率良いってこと?
-
-
名無しさんFireworksの料金体系が高いって話もある。別のプロバイダーで試す価値あり。
-
名無しさんTogether.aiだとどうなんだろう?情報求む。
-
-
名無しさん自分はローカルで動かしてるから関係ないけど、API勢は大変そうだな。
-
名無しさんローカルならトークン消費気にしなくていいからね。でも速度は落ちる。
-
-
名無しさんとりあえずFireworksに問い合わせ中。原因わかったら共有する。
-
名無しさん頼む!コスト管理が難しくて困ってる。
-
-
-
投稿者投稿
13件の返信を表示中(うち親返信7件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56