DeepSeek V4のプロンプトキャッシュ、本当に節約になってる?自分でトラッカー作って調べてみた

掲示板 フォーラム AI DeepSeek V4のプロンプトキャッシュ、本当に節約になってる?自分でトラッカー作って調べてみた

  • このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
21件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #64590 返信
      名無しさん
      Reddit r/LocalLLaMAで話題になってたスレッド「DeepSeek V4のプロンプトキャッシュって実際にコスト削減になってるの?自分でローカルトラッカーを作って検証してみた」という投稿を元に議論しよう。元ポストではAPIのキャッシュ機能がどれくらい効果あるか気になって、自分で使用量を記録するツールを自作したそうだ。結果的にキャッシュヒット率が思ったより低くて、思ってたほど節約にならなかったって話らしい。DeepSeek使ってる人、みんなはどう?キャッシュの恩恵感じてる?
      ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sw2dgp/is_deepseek_v4s_prompt_cache_actually_saving_you/

    • #64591 返信
      名無しさん
      キャッシュ効かないこと多いよね。特に長文のプロンプトだとヒット率低いわ

      • #64592 返信
        名無しさん
        そうそう、同じようなクエリでも微妙に違うとキャッシュ効かないし

    • #64593 返信
      名無しさん
      自作トラッカーって何で作ったんだろ?興味ある

      • #64594 返信
        名無しさん
        多分Pythonでrequests叩いてログ取るとかじゃない?

        • #64595 返信
          名無しさん
          実際にAPIのレスポンスヘッダーにキャッシュ情報含まれてるからそれを解析するんでしょ

    • #64596 返信
      名無しさん
      DeepSeek V4ってまだベータだっけ?安定してきた?

      • #64597 返信
        名無しさん
        コード生成はかなりいいって聞くけど、キャッシュはまだ改善余地ありかもね

    • #64598 返信
      名無しさん
      節約目的ならローカルで動かすのが一番じゃね?

      • #64599 返信
        名無しさん
        でもVRAM足りないし、速度も遅いからAPI使う人も多いんだよ

        • #64600 返信
          名無しさん
          Quantizedモデルならなんとか動くけど、精度落ちるしな

    • #64601 返信
      名無しさん
      キャッシュの恩恵受けるには、同じシステムプロンプトを使い回す設計が必要だよね

      • #64602 返信
        名無しさん
        うちのチームではテンプレート化してるから結構ヒットしてるよ

        • #64603 返信
          名無しさん
          それはいいね。でも動的な部分が多いと結局キャッシュ効かない

    • #64604 返信
      名無しさん
      DeepSeekの料金体系ってキャッシュヒットで半額とかになるんでしょ?

      • #64605 返信
        名無しさん
        そう、でも実質的に半額になるケースは少ないと思う

        • #64606 返信
          名無しさん
          だからこそのトラッカー自作か。実際のデータ見たい

    • #64607 返信
      名無しさん
      Redditの元スレ見てきたけど、OPがデータ公開してないんだよな。残念

      • #64608 返信
        名無しさん
        トラッカー自体を公開してほしいわ。自分でも試したい

        • #64609 返信
          名無しさん
          Githubに上げてるかもしれないから探してみる

    • #64610 返信
      名無しさん
      キャッシュ云々より、そもそもDeepSeek V4の性能が気になるわ。日本語はどう?

      • #64611 返信
        名無しさん
        日本語も結構いけるよ。コード生成ならClaudeより安くて良いかも

21件の返信を表示中(うち親返信8件)
返信先: DeepSeek V4のプロンプトキャッシュ、本当に節約になってる?自分でトラッカー作って調べてみた
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました