OmniRecall: ステートレスクラウドLLMにセマンティックリコールを追加するMITM+FAISSツール (DeepSeekでテスト、GPU不要)

このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。

15件の返信を表示中（うち親返信8件）

投稿者

投稿
- 2025年11月10日 8:54 AM #67362 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで話題のOmniRecallというツールについてのスレッドです。これはMITM(Man-In-The-Middle)とFAISSを使って、ステートレスなクラウドLLMにセマンティックリコール機能を追加するものだそうです。DeepSeekでテスト済みで、GPUは不要とのこと。ローカルLLMとクラウドのハイブリッド運用に関心がある方はどうぞ。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1rtznr7/omnirecall_mitm_faiss_semantic_recall_for/
- 2025年11月10日 8:55 AM #67363 返信
  
  名無しさん
  
  これって要はクラウドAPIの前段でプロンプトを補完する感じ？セッション管理をMITMでやるのは面白いけど、レイテンシーが心配。
  - 2025年11月10日 9:03 AM #67365 返信
    
    名無しさん
    
    >>2 レイテンシーはFAISSの検索とプロンプトのインジェクションだけだから、実用的な範囲だと思う。試した人の報告待ちだけど。
- 2025年11月10日 8:58 AM #67364 返信
  
  名無しさん
  
  GPU不要ってのがいいね。手元に高いGPUないからクラウドLLM使ってるけど、コンテキストが毎回リセットされるのが不便だった。これで改善されそう。
  - 2025年11月10日 9:12 AM #67367 返信
    
    名無しさん
    
    >>3 でもこれ、クラウド側にプロンプト送る前にユーザーの過去データを埋め込むんだろ？プライバシーの観点でちょっと気になる。ローカルで全部完結する方が安心。
    - 2025年11月10日 9:30 AM #67370 返信
      
      名無しさん
      
      >>6 同意。クラウドに全部履歴送るのは避けたい。でもローカルLLMじゃ性能が出ないから、トレードオフか。
- 2025年11月10日 9:10 AM #67366 返信
  
  名無しさん
  
  DeepSeekでテストってあるけど、他のモデルでも動くのかな？ClaudeとかGPTでも原理的には行けるはず。
  - 2025年11月10日 9:21 AM #67369 返信
    
    名無しさん
    
    >>5 ソースによるとAPIのラッパーだから、多分どのプロバイダーでも使える。ただ、プロンプトのフォーマットに依存するかも。
- 2025年11月10日 9:15 AM #67368 返信
  
  名無しさん
  
  FAISSのインデックスをどう管理するかが鍵だね。ディスクに保存するのか、メモリだけか。大規模になるとメモリ食いそう。
- 2025年11月10日 9:32 AM #67371 返信
  
  名無しさん
  
  これってRAGの一種？それともセッション管理専用？RAGだと外部知識ベース必要だけど、OmniRecallは会話履歴に特化してる感じ。
  - 2025年11月10日 9:34 AM #67372 返信
    
    名無しさん
    
    >>10 RAGのサブセットみたいなものじゃない？セマンティックリコールって言ってるし、過去の会話から関連部分をFAISSで検索するんでしょ。
- 2025年11月10日 9:38 AM #67373 返信
  
  名無しさん
  
  セットアップが簡単なら試してみたい。GitHub見たらpip installで行けるみたい。週末にでも試すわ。
  - 2025年11月10日 9:45 AM #67374 返信
    
    名無しさん
    
    >>12 試したらレポートしてほしい。特にDeepSeekとの組み合わせでどんな感じか気になる。
- 2025年11月10日 9:56 AM #67375 返信
  
  名無しさん
  
  個人的にはローカルLLM（Llama 3とか）でも似たようなことができるならそっちを使うけど、OmniRecallはクラウドユーザー向けのニッチを突いてるね。
  - 2025年11月10日 9:58 AM #67376 返信
    
    名無しさん
    
    >>14 でもローカルだと量子化モデルで速度犠牲になるし、クラウドの性能を活かしたいならありかも。コスト次第だけど。
- 2025年11月10日 10:01 AM #67377 返信
  
  名無しさん
  
  FAISSのベクトル検索って結構メモリ使うから、大量の会話履歴を扱うとクラウドのAPI料金以上にコストかかりそう。イーストが安いならいいけど。
投稿者

投稿

15件の返信を表示中（うち親返信8件）

返信先: OmniRecall: ステートレスクラウドLLMにセマンティックリコールを追加するMITM+FAISSツール (DeepSeekでテスト、GPU不要)

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック