OmniRecall: ステートレスクラウドLLMにセマンティックリコールを追加するMITM+FAISSツール (DeepSeekでテスト、GPU不要)

掲示板 フォーラム AI OmniRecall: ステートレスクラウドLLMにセマンティックリコールを追加するMITM+FAISSツール (DeepSeekでテスト、GPU不要)

  • このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
15件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #67362 返信
      名無しさん
      Redditのr/LocalLLaMAで話題のOmniRecallというツールについてのスレッドです。これはMITM(Man-In-The-Middle)とFAISSを使って、ステートレスなクラウドLLMにセマンティックリコール機能を追加するものだそうです。DeepSeekでテスト済みで、GPUは不要とのこと。ローカルLLMとクラウドのハイブリッド運用に関心がある方はどうぞ。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1rtznr7/omnirecall_mitm_faiss_semantic_recall_for/

    • #67363 返信
      名無しさん
      これって要はクラウドAPIの前段でプロンプトを補完する感じ?セッション管理をMITMでやるのは面白いけど、レイテンシーが心配。

      • #67365 返信
        名無しさん
        >>2 レイテンシーはFAISSの検索とプロンプトのインジェクションだけだから、実用的な範囲だと思う。試した人の報告待ちだけど。

    • #67364 返信
      名無しさん
      GPU不要ってのがいいね。手元に高いGPUないからクラウドLLM使ってるけど、コンテキストが毎回リセットされるのが不便だった。これで改善されそう。

      • #67367 返信
        名無しさん
        >>3 でもこれ、クラウド側にプロンプト送る前にユーザーの過去データを埋め込むんだろ?プライバシーの観点でちょっと気になる。ローカルで全部完結する方が安心。

        • #67370 返信
          名無しさん
          >>6 同意。クラウドに全部履歴送るのは避けたい。でもローカルLLMじゃ性能が出ないから、トレードオフか。

    • #67366 返信
      名無しさん
      DeepSeekでテストってあるけど、他のモデルでも動くのかな?ClaudeとかGPTでも原理的には行けるはず。

      • #67369 返信
        名無しさん
        >>5 ソースによるとAPIのラッパーだから、多分どのプロバイダーでも使える。ただ、プロンプトのフォーマットに依存するかも。

    • #67368 返信
      名無しさん
      FAISSのインデックスをどう管理するかが鍵だね。ディスクに保存するのか、メモリだけか。大規模になるとメモリ食いそう。

    • #67371 返信
      名無しさん
      これってRAGの一種?それともセッション管理専用?RAGだと外部知識ベース必要だけど、OmniRecallは会話履歴に特化してる感じ。

      • #67372 返信
        名無しさん
        >>10 RAGのサブセットみたいなものじゃない?セマンティックリコールって言ってるし、過去の会話から関連部分をFAISSで検索するんでしょ。

    • #67373 返信
      名無しさん
      セットアップが簡単なら試してみたい。GitHub見たらpip installで行けるみたい。週末にでも試すわ。

      • #67374 返信
        名無しさん
        >>12 試したらレポートしてほしい。特にDeepSeekとの組み合わせでどんな感じか気になる。

    • #67375 返信
      名無しさん
      個人的にはローカルLLM(Llama 3とか)でも似たようなことができるならそっちを使うけど、OmniRecallはクラウドユーザー向けのニッチを突いてるね。

      • #67376 返信
        名無しさん
        >>14 でもローカルだと量子化モデルで速度犠牲になるし、クラウドの性能を活かしたいならありかも。コスト次第だけど。

    • #67377 返信
      名無しさん
      FAISSのベクトル検索って結構メモリ使うから、大量の会話履歴を扱うとクラウドのAPI料金以上にコストかかりそう。イーストが安いならいいけど。

15件の返信を表示中(うち親返信8件)
返信先: OmniRecall: ステートレスクラウドLLMにセマンティックリコールを追加するMITM+FAISSツール (DeepSeekでテスト、GPU不要)で#67368に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました