DeepSeek V4, R1, Claude をリクエスト複雑度で振り分けるOpenAI互換プロキシの話題

名無しさん · 2025-11-05T10:56:18+09:00

Redditの r/LocalLLaMA で話題になっている、リクエストの複雑さに応じてDeepSeek V4、R1、Claudeを自動ルーティングするOpenAI互換プロキシについてのスレッドです。元の投稿: https://www.reddit.com/r/LocalLLaMA/comments/1s3rn51/openaicompatible_proxy_that_routes_between/ こういうプロキシ、実用性ありそうですか？各自の使用感や懸念点をどうぞ。

このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。

16件の返信を表示中（うち親返信8件）

投稿者

投稿
- 2025年11月5日 10:56 AM #66636 返信
  
  名無しさん
  
  Redditの r/LocalLLaMA で話題になっている、リクエストの複雑さに応じてDeepSeek V4、R1、Claudeを自動ルーティングするOpenAI互換プロキシについてのスレッドです。
  元の投稿: https://www.reddit.com/r/LocalLLaMA/comments/1s3rn51/openaicompatible_proxy_that_routes_between/
  
  こういうプロキシ、実用性ありそうですか？各自の使用感や懸念点をどうぞ。
- 2025年11月5日 10:57 AM #66637 返信
  
  名無しさん
  
  面白いアイデアだけど、複雑度の判定ってどうやってるんだろう？トークン数だけだと精度低そう。
  - 2025年11月5日 11:05 AM #66639 返信
    
    名無しさん
    
    たぶんプロンプトの長さやキーワード、モデルの応答時間とかで判断してるんじゃない？精度は未知数だけど。
    - 2025年11月5日 11:12 AM #66640 返信
      
      名無しさん
      
      そういうプロキシ、結局はベストエフォートになるから、頻繁に使うなら固定モデルの方が安定する気がする。
- 2025年11月5日 11:00 AM #66638 返信
  
  名無しさん
  
  自作するならLangChainとかで似たようなことできそう。でもコスト管理が難しそうだな。
- 2025年11月5日 11:14 AM #66641 返信
  
  名無しさん
  
  DeepSeek V4ってまだ出てないよね？このスレでは将来の話として出てるのかな？
  - 2025年11月5日 11:17 AM #66642 返信
    
    名無しさん
    
    RedditではDeepSeekの次期モデルをV4って呼んでることが多いよ。でも正式名称じゃないかも。
- 2025年11月5日 11:23 AM #66643 返信
  
  名無しさん
  
  ClaudeはAPI高いから、複雑な質問だけClaudeに回すってのはコスト削減になるかもね。
  - 2025年11月5日 11:32 AM #66644 返信
    
    名無しさん
    
    でもClaudeの得意分野を間違えると逆にコスト増になるリスクもある。
- 2025年11月5日 11:34 AM #66645 返信
  
  名無しさん
  
  素直にOpenRouterみたいなサービス使った方が楽じゃない？自分でプロキシ立てる手間考えたら。
  - 2025年11月5日 11:36 AM #66646 返信
    
    名無しさん
    
    OpenRouterだとモデル選択は手動だから、自動振り分けは需要あると思うよ。使い分け自動化したい人はいる。
- 2025年11月5日 11:40 AM #66647 返信
  
  名無しさん
  
  こういうプロキシってオープンソースで公開されるのかな？ソース見てみたい。
  - 2025年11月5日 11:47 AM #66648 返信
    
    名無しさん
    
    Redditの投稿者はまだコード公開してないみたい。でも需要あればすぐ出てきそう。
- 2025年11月5日 11:58 AM #66649 返信
  
  名無しさん
  
  複雑度判定にLLM自身を使うってのもありか。でもそれ自体がコストとレイテンシの増加になるな。
  - 2025年11月5日 12:00 PM #66650 返信
    
    名無しさん
    
    確かに、ルーティングのための呼び出しが無駄になる可能性もある。軽量モデルで判定するのがベターかも。
- 2025年11月5日 12:03 PM #66651 返信
  
  名無しさん
  
  個人的には自分で選びたい派。でもチームで使うなら自動化も理解できる。
  - 2025年11月5日 12:08 PM #66652 返信
    
    名無しさん
    
    そうそう、複数人で使うときは自動で適切なモデルに飛ぶのは便利。特に非エンジニア向け。
投稿者

投稿

16件の返信を表示中（うち親返信8件）

返信先: DeepSeek V4, R1, Claude をリクエスト複雑度で振り分けるOpenAI互換プロキシの話題で#66650に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック