- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 1週前に更新されました。
23件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA に投稿された記事の紹介です。PersonaPlexというツールをフォークし、DeepSeekモデルに対してドメインクエリをTTS(Text-to-Speech)インジェクション経由でルーティングする試みが行われました。著者は成功した点と失敗した点を詳細にまとめています。コードやコスト、プライバシー、ベンチマークなどについて議論が交わされています。元記事: https://www.reddit.com/r/LocalLLaMA/comments/1rf4jmz/p_forked_personaplex_to_route_domain_queries_to/
-
名無しさんTTSインジェクションってどういう仕組み?音声認識のプロセスに割り込む感じ?
-
名無しさん多分、テキストを音声に変換してからモデルに渡すことで、プロンプトの構造を変えるテクニックだと思う。
-
名無しさんでもTTSってレイテンシー増えるし、精度落ちるリスクもあるんじゃない?
-
名無しさんレイテンシーは確かに気になる。音声合成の速度にもよるけど、リアルタイム会話には向かないかも。
-
-
-
-
名無しさんDeepSeekのAPIコストが気になるな。ローカルで動かすより安いの?
-
名無しさんDeepSeekは比較的安いけど、大量に使うと馬鹿にならないよ。ローカルLLMで済ませた方が節約になる場合もある。
-
名無しさん確かに。ローカルでMixtralとか使う手もあるし、用途次第だな。
-
-
-
名無しさんPersonaPlexって初めて聞いた。どんなツール?
-
名無しさんPersonaPlexは複数の人格(ペルソナ)を切り替えて会話できるツールみたい。今回のフォークはそれにTTSを組み合わせたってことか。
-
-
名無しさん失敗した点も書いてあるから参考になる。正直なレポートがいいね。
-
名無しさん失敗の共有は貴重。特にTTSの品質がネックになったって書いてあったね。
-
-
名無しさんコードが公開されてるなら試してみたいけど、環境構築が面倒そう。
-
名無しさんDocker composeで一発とかならいいけど、そうじゃないと導入ハードル高いよね。
-
-
名無しさんドメインクエリって特定の分野の質問のこと?それともDNSとか?
-
名無しさん文脈からすると、特定のトピック(ドメイン)に関するクエリって意味だと思う。深層学習のドメイン知識をルーティングする話じゃない?
-
-
名無しさんDeepSeekのベンチマークってどのくらい?ローカルLLMと比較してどうなの?
-
名無しさん個人的にはDeepSeek-Coderがコード生成で結構優秀だと思う。でも最新モデルはv3とか?よく分からん。
-
-
名無しさんPersonaPlexのフォークって、元のライセンス的に大丈夫なの?
-
名無しさん多分OSSだと思うけど、確認した方がいいね。
-
-
名無しさんこういう試行錯誤のレポートは好き。実際に動かす前に知っておくべきことが多い。
-
名無しさん同意。でも実験的なアプローチとして面白いから、時間あるときに試してみたい。
-
-
名無しさんDeepSeekのプライバシーポリシーはどうなってるの?データ保持とか気になる。
-
名無しさん個人的には、こういうテクニックよりもシンプルなプロンプトエンジニアリングの方が楽だと思う。
-
-
投稿者投稿
23件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44