DeepSeek V4のプロンプトキャッシュ、本当に節約になってる？自分でトラッカー作って調べてみた

名無しさん · 2025-10-22T15:35:51+09:00

Reddit r/LocalLLaMAで話題になってたスレッド「DeepSeek V4のプロンプトキャッシュって実際にコスト削減になってるの？自分でローカルトラッカーを作って検証してみた」という投稿を元に議論しよう。元ポストではAPIのキャッシュ機能がどれくらい効果あるか気になって、自分で使用量を記録するツールを自作したそうだ。結果的にキャッシュヒット率が思ったより低くて、思ってたほど節約にならなかったって話らしい。DeepSeek使ってる人、みんなはどう？キャッシュの恩恵感じてる？ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sw2dgp/is_deepseek_v4s_prompt_cache_actually_saving_you/

このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。

21件の返信を表示中（うち親返信8件）

投稿者

投稿
- 2025年10月22日 3:35 PM #64590 返信
  
  名無しさん
  
  Reddit r/LocalLLaMAで話題になってたスレッド「DeepSeek V4のプロンプトキャッシュって実際にコスト削減になってるの？自分でローカルトラッカーを作って検証してみた」という投稿を元に議論しよう。元ポストではAPIのキャッシュ機能がどれくらい効果あるか気になって、自分で使用量を記録するツールを自作したそうだ。結果的にキャッシュヒット率が思ったより低くて、思ってたほど節約にならなかったって話らしい。DeepSeek使ってる人、みんなはどう？キャッシュの恩恵感じてる？
  ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sw2dgp/is_deepseek_v4s_prompt_cache_actually_saving_you/
- 2025年10月22日 3:37 PM #64591 返信
  
  名無しさん
  
  キャッシュ効かないこと多いよね。特に長文のプロンプトだとヒット率低いわ
  - 2025年10月22日 3:40 PM #64592 返信
    
    名無しさん
    
    そうそう、同じようなクエリでも微妙に違うとキャッシュ効かないし
- 2025年10月22日 3:44 PM #64593 返信
  
  名無しさん
  
  自作トラッカーって何で作ったんだろ？興味ある
  - 2025年10月22日 3:51 PM #64594 返信
    
    名無しさん
    
    多分Pythonでrequests叩いてログ取るとかじゃない？
    - 2025年10月22日 3:53 PM #64595 返信
      
      名無しさん
      
      実際にAPIのレスポンスヘッダーにキャッシュ情報含まれてるからそれを解析するんでしょ
- 2025年10月22日 3:57 PM #64596 返信
  
  名無しさん
  
  DeepSeek V4ってまだベータだっけ？安定してきた？
  - 2025年10月22日 4:03 PM #64597 返信
    
    名無しさん
    
    コード生成はかなりいいって聞くけど、キャッシュはまだ改善余地ありかもね
- 2025年10月22日 4:12 PM #64598 返信
  
  名無しさん
  
  節約目的ならローカルで動かすのが一番じゃね？
  - 2025年10月22日 4:13 PM #64599 返信
    
    名無しさん
    
    でもVRAM足りないし、速度も遅いからAPI使う人も多いんだよ
    - 2025年10月22日 4:16 PM #64600 返信
      
      名無しさん
      
      Quantizedモデルならなんとか動くけど、精度落ちるしな
- 2025年10月22日 4:20 PM #64601 返信
  
  名無しさん
  
  キャッシュの恩恵受けるには、同じシステムプロンプトを使い回す設計が必要だよね
  - 2025年10月22日 4:26 PM #64602 返信
    
    名無しさん
    
    うちのチームではテンプレート化してるから結構ヒットしてるよ
    - 2025年10月22日 4:38 PM #64603 返信
      
      名無しさん
      
      それはいいね。でも動的な部分が多いと結局キャッシュ効かない
- 2025年10月22日 4:40 PM #64604 返信
  
  名無しさん
  
  DeepSeekの料金体系ってキャッシュヒットで半額とかになるんでしょ？
  - 2025年10月22日 4:42 PM #64605 返信
    
    名無しさん
    
    そう、でも実質的に半額になるケースは少ないと思う
    - 2025年10月22日 4:47 PM #64606 返信
      
      名無しさん
      
      だからこそのトラッカー自作か。実際のデータ見たい
- 2025年10月22日 4:55 PM #64607 返信
  
  名無しさん
  
  Redditの元スレ見てきたけど、OPがデータ公開してないんだよな。残念
  - 2025年10月22日 4:57 PM #64608 返信
    
    名無しさん
    
    トラッカー自体を公開してほしいわ。自分でも試したい
    - 2025年10月22日 5:01 PM #64609 返信
      
      名無しさん
      
      Githubに上げてるかもしれないから探してみる
- 2025年10月22日 5:06 PM #64610 返信
  
  名無しさん
  
  キャッシュ云々より、そもそもDeepSeek V4の性能が気になるわ。日本語はどう？
  - 2025年10月22日 5:16 PM #64611 返信
    
    名無しさん
    
    日本語も結構いけるよ。コード生成ならClaudeより安くて良いかも
投稿者

投稿

21件の返信を表示中（うち親返信8件）

返信先: DeepSeek V4のプロンプトキャッシュ、本当に節約になってる？自分でトラッカー作って調べてみた

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック