DeepSeekのキャッシュヒット率99.9%を実現するmemory-keeperというツール

このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。

16件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年2月11日 10:54 PM #61139 返信
  
  名無しさん
  
  RedditのLocalLLaMAサブレに投稿されたmemory-keeperというツールの話題です。DeepSeekのAPI呼び出しに対して3層プロキシを構築し、キャッシュヒット率99.9%を達成したとのこと。コスト削減や応答速度向上に効果がありそうですが、具体的な実装や注意点について議論したいと思います。
- 2025年2月11日 10:56 PM #61140 返信
  
  名無しさん
  
  99.9%ってすごいな。でもキャッシュってどうやって実現してるんだろう？
  - 2025年2月11日 10:59 PM #61141 返信
    
    名無しさん
    
    多分プロンプトの埋め込みをキーにして、同じリクエストならキャッシュから返すんだと思う。ただDeepSeekのAPIだとキャッシュポリシーとかもあるし、完全にローカルでやるのは難しそう。
  - 2025年2月11日 11:03 PM #61142 返信
    
    名無しさん
    
    プロキシを挟んでキャッシュするってことだよね。VLMみたいに画像キャッシュとは違うし、テキスト生成のキャッシュって結構複雑そう。
- 2025年2月11日 11:10 PM #61143 返信
  
  名無しさん
  
  これって料金節約になるのかな？DeepSeekのAPIはもう安いけど、キャッシュでさらに安くなるなら試してみたい。
  - 2025年2月11日 11:12 PM #61144 返信
    
    名無しさん
    
    トークン数にもよるけど、同じ質問を何度も投げるようなケースだと効果絶大だね。チャットボットとかならかなり使える。
- 2025年2月11日 11:16 PM #61145 返信
  
  名無しさん
  
  3-tier proxyってどういう構成なんだろう？最初の層はクライアントサイドのキャッシュ、2層目がサーバーサイド、3層目がAPIプロバイダのキャッシュとか？
  - 2025年2月11日 11:22 PM #61146 返信
    
    名無しさん
    
    おそらくメモリ上のキャッシュ、ディスクキャッシュ、そして分散キャッシュみたいな感じじゃない？Redditの元ポストにも詳細があったはず。
- 2025年2月11日 11:31 PM #61147 返信
  
  名無しさん
  
  でも99.9%って正直信じがたいな。キャッシュミスが0.1%しかないってかなり理想的すぎない？
  - 2025年2月11日 11:32 PM #61148 返信
    
    名無しさん
    
    実際のユースケース次第だと思うけど、特定のプロンプトパターンに偏らせれば可能かもしれない。汎用的には難しいかも。
- 2025年2月11日 11:35 PM #61149 返信
  
  名無しさん
  
  こういうツールを使うと、DeepSeekのモデルの品質とキャッシュの両方が気になるね。キャッシュが古いモデルだったらどうするんだろう？
  - 2025年2月11日 11:39 PM #61150 返信
    
    名無しさん
    
    バージョン管理してれば大丈夫じゃない？でもモデルのアップデートが頻繁だとキャッシュが無駄になる可能性もある。
- 2025年2月11日 11:45 PM #61151 返信
  
  名無しさん
  
  個人的にはLocal LLM派だけど、クラウドAPIでもキャッシュがしっかりしてれば十分使えるかも。
  - 2025年2月11日 11:57 PM #61152 返信
    
    名無しさん
    
    確かに。でもプライバシーの観点からAPIに送るのはあまり気が進まない。キャッシュで解決できる問題じゃないし。
- 2025年2月11日 11:59 PM #61153 返信
  
  名無しさん
  
  DeepSeekのAPIは最近爆速になってるけど、キャッシュでさらに速くなるなら嬉しい。OSS化されてないのかな？
  - 2025年2月12日 12:02 AM #61154 返信
    
    名無しさん
    
    GitHubで公開されてるみたいだよ。memory-keeperって名前で検索すれば出てくるはず。まだstar少ないけど。
    - 2025年2月12日 12:06 AM #61155 返信
      
      名無しさん
      
      おお、ありがとう。後で見てみる。プロキシの設定とか面倒じゃなければ試してみたい。
投稿者

投稿

16件の返信を表示中（うち親返信7件）

返信先: DeepSeekのキャッシュヒット率99.9%を実現するmemory-keeperというツールで#61150に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック