DeepSeek V4のプロンプトキャッシュ、本当にコスト削減になってる？実際にトラッカー作って検証してみた

名無しさん · 2025-10-17T08:59:51+09:00

Redditのr/LocalLLaMAで、DeepSeek V4のプロンプトキャッシュ機能が実際にどれだけコスト削減になるのか、自分でローカルトラッカーを作って検証したというスレがありました。APIの使用量やキャッシュヒット率を細かく追跡して、思ったより効果があったとか、逆にキャッシュが効かないケースもあるとか、議論になってます。URL: この話題について、みなさんの実際の使用感や測定結果を聞かせてください。

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。

27件の返信を表示中（うち親返信13件）

投稿者

投稿
- 2025年10月17日 8:59 AM #63763 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek V4のプロンプトキャッシュ機能が実際にどれだけコスト削減になるのか、自分でローカルトラッカーを作って検証したというスレがありました。APIの使用量やキャッシュヒット率を細かく追跡して、思ったより効果があったとか、逆にキャッシュが効かないケースもあるとか、議論になってます。URL: この話題について、みなさんの実際の使用感や測定結果を聞かせてください。
- 2025年10月17日 9:01 AM #63764 返信
  
  名無しさん
  
  プロンプトキャッシュ、自分も気になってた。特に長いコンテキストを何度も投げるようなワークフローだと効果ありそう。
  - 2025年10月17日 9:08 AM #63766 返信
    
    名無しさん
    
    トラッカー使ってみたけど、確かにシステムプロンプトとか固定部分はよくキャッシュされる。でもユーザー入力が毎回違うとほとんどヒットしない。
- 2025年10月17日 9:04 AM #63765 返信
  
  名無しさん
  
  キャッシュのヒット率ってどれくらいなんだろう？自分の使い方だと毎回微妙にプロンプトが変わるからあんまり効かなそう。
- 2025年10月17日 9:15 AM #63767 返信
  
  名無しさん
  
  DeepSeekって料金体系がややこしいから、キャッシュでどれだけ節約できるか知りたい。公式の説明だけだとよくわからん。
  - 2025年10月17日 9:17 AM #63768 返信
    
    名無しさん
    
    APIのドキュメント読む限り、キャッシュヒットすると半分くらいのトークン数で計算されるっぽい。実際に試した人いる？
    - 2025年10月17日 9:21 AM #63769 返信
      
      名無しさん
      
      うちのトラッカーでは、キャッシュ有効で約30%のトークン削減になってた。ただしキャッシュの有効期限とかあるらしいから、長時間空けるとリセットされるみたい。
- 2025年10月17日 9:27 AM #63770 返信
  
  名無しさん
  
  ローカルで動かす方が最終的に安いと思うんだが、DeepSeekの安さには敵わないか？
  - 2025年10月17日 9:36 AM #63771 返信
    
    名無しさん
    
    ローカルは電気代とGPU代考えると意外とかかる。APIのキャッシュうまく使えばバランス良いかも。
- 2025年10月17日 9:37 AM #63772 返信
  
  名無しさん
  
  てかDeepSeek V4ってまだ出てないんじゃ？ベータとか？
  - 2025年10月17日 9:40 AM #63773 返信
    
    名無しさん
    
    最近のアップデートでプロンプトキャッシュが正式機能になったらしい。モデル自体はV4って呼ばれてるけど、実はバージョン番号は公開されてないから注意。
  - 2025年10月17日 9:44 AM #63774 返信
    
    名無しさん
    
    RedditのスレでもV4って呼んでるけど、実際はDeepSeek-Chatとかの最新版って感じ。名前は適当でいいんじゃね。
- 2025年10月17日 9:50 AM #63775 返信
  
  名無しさん
  
  自分もトラッカー作ってみようかな。どの言語で書いたんだろう？ Pythonだと思うけど。
  - 2025年10月17日 10:02 AM #63776 返信
    
    名無しさん
    
    多分Pythonのrequestsライブラリ使って、レスポンスヘッダーからキャッシュ情報取得してるんじゃないかな。自分も真似してみる。
- 2025年10月17日 10:04 AM #63777 返信
  
  名無しさん
  
  キャッシュの仕組み自体はいいけど、プライバシー的にキャッシュにプロンプト残るのが嫌だな。ローカルで使う分には問題ないけど。
  - 2025年10月17日 10:06 AM #63778 返信
    
    名無しさん
    
    DeepSeekのプライバシーポリシー読んだら、キャッシュは一定期間で消去されるっぽい。でも完全に信用はできないよね。
- 2025年10月17日 10:11 AM #63779 返信
  
  名無しさん
  
  キャッシュ効かせたいならシステムプロンプトを固定にするのがコツらしい。よく使うテンプレートは使い回すようにしてる。
  - 2025年10月17日 10:19 AM #63780 返信
    
    名無しさん
    
    なるほど。自分もテンプレート見直してみるわ。
- 2025年10月17日 10:21 AM #63781 返信
  
  名無しさん
  
  DeepSeekって他のモデルと比べてどうなの？コーディング性能とか。
  - 2025年10月17日 10:25 AM #63782 返信
    
    名無しさん
    
    コード生成は結構優秀だよ。ただプロンプトキャッシュの効果はコーディングのタスクによって違う。同じコードの修正とかだとキャッシュ効きやすい。
  - 2025年10月17日 10:30 AM #63783 返信
    
    名無しさん
    
    ベンチマークではGPT-4oに肉薄してるって話もあるけど、実際に使うと微妙な部分もある。キャッシュでコスト下がれば良い選択肢になる。
- 2025年10月17日 10:40 AM #63784 返信
  
  名無しさん
  
  今のところClaudeの方が好みだけど、DeepSeekの安さは魅力。キャッシュでさらに安くなれば乗り換えるかも。
  - 2025年10月17日 10:42 AM #63785 返信
    
    名無しさん
    
    俺は逆にDeepSeekメインで使ってる。キャッシュヒット率が高いワークロードならかなりお得。
- 2025年10月17日 10:45 AM #63786 返信
  
  名無しさん
  
  トラッカー、OSSで公開してほしいな。自分で作るのは面倒。
  - 2025年10月17日 10:49 AM #63787 返信
    
    名無しさん
    
    Redditのスレ主がGitHubに公開予定って言ってた気がする。待ちきれずに自分で書いたけど。
- 2025年10月17日 10:56 AM #63788 返信
  
  名無しさん
  
  キャッシュの効果は想像以上だった。特に会話型のアプリでコンテキストを引き継ぐときにすごく効く。
  - 2025年10月17日 11:08 AM #63789 返信
    
    名無しさん
    
    そうそう。チャットボット運用には必須の機能だと思う。
- 2025年10月17日 11:09 AM #63790 返信
  
  名無しさん
  
  総じて、キャッシュはあると便利だけど、使い方次第って感じだね。自分のケースに合うか試してみるのが大事。
投稿者

投稿

27件の返信を表示中（うち親返信13件）

返信先: DeepSeek V4のプロンプトキャッシュ、本当にコスト削減になってる？実際にトラッカー作って検証してみたで#63786に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック