- このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより11ヶ月、 1週前に更新されました。
16件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditの 話題になっている、リクエストの複雑さに応じてDeepSeek V4、R1、Claudeを自動ルーティングするOpenAI互換プロキシについてのスレッドです。
元の投稿: こういうプロキシ、実用性ありそうですか?各自の使用感や懸念点をどうぞ。 -
名無しさん面白いアイデアだけど、複雑度の判定ってどうやってるんだろう?トークン数だけだと精度低そう。
-
名無しさんたぶんプロンプトの長さやキーワード、モデルの応答時間とかで判断してるんじゃない?精度は未知数だけど。
-
名無しさんそういうプロキシ、結局はベストエフォートになるから、頻繁に使うなら固定モデルの方が安定する気がする。
-
-
-
名無しさん自作するならLangChainとかで似たようなことできそう。でもコスト管理が難しそうだな。
-
名無しさんDeepSeek V4ってまだ出てないよね?このスレでは将来の話として出てるのかな?
-
名無しさんRedditではDeepSeekの次期モデルをV4って呼んでることが多いよ。でも正式名称じゃないかも。
-
-
名無しさんClaudeはAPI高いから、複雑な質問だけClaudeに回すってのはコスト削減になるかもね。
-
名無しさんでもClaudeの得意分野を間違えると逆にコスト増になるリスクもある。
-
-
名無しさん素直にOpenRouterみたいなサービス使った方が楽じゃない?自分でプロキシ立てる手間考えたら。
-
名無しさんOpenRouterだとモデル選択は手動だから、自動振り分けは需要あると思うよ。使い分け自動化したい人はいる。
-
-
名無しさんこういうプロキシってオープン公開されるのかな?見てみたい。
-
名無しさんRedditの投稿者はまだコード公開してないみたい。でも需要あればすぐ出てきそう。
-
-
名無しさん複雑度判定にLLM自身を使うってのもありか。でもそれ自体がコストとレイテンシの増加になるな。
-
名無しさん確かに、ルーティングのための呼び出しが無駄になる可能性もある。軽量モデルで判定するのがベターかも。
-
-
名無しさん個人的には自分で選びたい派。でもチームで使うなら自動化も理解できる。
-
名無しさんそうそう、複数人で使うときは自動で適切なモデルに飛ぶのは便利。特に非エンジニア向け。
-
-
-
投稿者投稿
16件の返信を表示中(うち親返信8件)
関連するAIトピック
- ECCV2024のレビュー結果が出たみたいだけどどう?24件の返信最終更新 2024年8月25日 19:35
- ICCV 2025 リビュータルについて語ろう18件の返信最終更新 2024年8月25日 23:41
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2024年8月25日 17:26
- シンプルなアイデアをML学会で発表する難しさについて15件の返信最終更新 2024年8月25日 12:57
- ML研究者、論文の再投稿は何回が普通?16件の返信最終更新 2024年8月25日 10:23