DeepSeekのキャッシュヒット率99.9%を実現するmemory-keeperというツール

掲示板 フォーラム AI DeepSeekのキャッシュヒット率99.9%を実現するmemory-keeperというツール

  • このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
16件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #61139 返信
      名無しさん
      RedditのLocalLLaMAサブレに投稿されたmemory-keeperというツールの話題です。DeepSeekのAPI呼び出しに対して3層プロキシを構築し、キャッシュヒット率99.9%を達成したとのこと。コスト削減や応答速度向上に効果がありそうですが、具体的な実装や注意点について議論したいと思います。

    • #61140 返信
      名無しさん
      99.9%ってすごいな。でもキャッシュってどうやって実現してるんだろう?

      • #61141 返信
        名無しさん
        多分プロンプトの埋め込みをキーにして、同じリクエストならキャッシュから返すんだと思う。ただDeepSeekのAPIだとキャッシュポリシーとかもあるし、完全にローカルでやるのは難しそう。

      • #61142 返信
        名無しさん
        プロキシを挟んでキャッシュするってことだよね。VLMみたいに画像キャッシュとは違うし、テキスト生成のキャッシュって結構複雑そう。

    • #61143 返信
      名無しさん
      これって料金節約になるのかな?DeepSeekのAPIはもう安いけど、キャッシュでさらに安くなるなら試してみたい。

      • #61144 返信
        名無しさん
        トークン数にもよるけど、同じ質問を何度も投げるようなケースだと効果絶大だね。チャットボットとかならかなり使える。

    • #61145 返信
      名無しさん
      3-tier proxyってどういう構成なんだろう?最初の層はクライアントサイドのキャッシュ、2層目がサーバーサイド、3層目がAPIプロバイダのキャッシュとか?

      • #61146 返信
        名無しさん
        おそらくメモリ上のキャッシュ、ディスクキャッシュ、そして分散キャッシュみたいな感じじゃない?Redditの元ポストにも詳細があったはず。

    • #61147 返信
      名無しさん
      でも99.9%って正直信じがたいな。キャッシュミスが0.1%しかないってかなり理想的すぎない?

      • #61148 返信
        名無しさん
        実際のユースケース次第だと思うけど、特定のプロンプトパターンに偏らせれば可能かもしれない。汎用的には難しいかも。

    • #61149 返信
      名無しさん
      こういうツールを使うと、DeepSeekのモデルの品質とキャッシュの両方が気になるね。キャッシュが古いモデルだったらどうするんだろう?

      • #61150 返信
        名無しさん
        バージョン管理してれば大丈夫じゃない?でもモデルのアップデートが頻繁だとキャッシュが無駄になる可能性もある。

    • #61151 返信
      名無しさん
      個人的にはLocal LLM派だけど、クラウドAPIでもキャッシュがしっかりしてれば十分使えるかも。

      • #61152 返信
        名無しさん
        確かに。でもプライバシーの観点からAPIに送るのはあまり気が進まない。キャッシュで解決できる問題じゃないし。

    • #61153 返信
      名無しさん
      DeepSeekのAPIは最近爆速になってるけど、キャッシュでさらに速くなるなら嬉しい。OSS化されてないのかな?

      • #61154 返信
        名無しさん
        GitHubで公開されてるみたいだよ。memory-keeperって名前で検索すれば出てくるはず。まだstar少ないけど。

        • #61155 返信
          名無しさん
          おお、ありがとう。後で見てみる。プロキシの設定とか面倒じゃなければ試してみたい。

16件の返信を表示中(うち親返信7件)
返信先: DeepSeekのキャッシュヒット率99.9%を実現するmemory-keeperというツールで#61148に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました