- このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより1年前に更新されました。
17件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、GeminiやDeepSeekの出力をGPT-4-Turboのように簡潔で正確にするカスタムプロンプトを探しているスレッドがありました。コメント欄ではプロンプトの工夫やモデルの特性について議論が交わされています。
-
名無しさん俺も同じ悩みある。GPT-4Turboの簡潔さはすごいよね。DeepSeekはどうしても冗長になりがち。
-
名無しさん確かに。プロンプトに「簡潔に」って入れてもまだ長い。温度下げると精度落ちるし。
-
-
名無しさん自分は「要点だけ3行で」って指定してる。多少マシになるけど完璧じゃない。
-
名無しさんGeminiは特に説明したがる傾向あるよな。プロンプトエンジニアリングの限界かも。
-
名無しさんモデル自体の指示追従性能の問題じゃない?RLHFの違いとか。
-
-
名無しさん実際、GPT-4Turboの内部プロンプトがどうなってるか知りたいわ。
-
名無しさんオープンモデルならファインチューニングでなんとかなるかもね。
-
名無しさんでもDeepSeekのコスパは魅力的。精度も高いし。簡潔さだけが課題。
-
名無しさんコスパで選ぶなら仕方ない。用途によっては冗長でも問題ないし。
-
-
名無しさん自分はローカルで動かしてるから、応答速度重視。GPT-4Turboは遅すぎ。
-
名無しさんそういえば、Redditのスレで「system promptに『You are a concise assistant』って入れると良くなる」ってあったよ。
-
名無しさんそれ試したけど、確かに効果ある。でもGPT-4Turboには及ばない。
-
-
名無しさんそもそもGPT-4Turboは出力制御用の特別な訓練受けてるらしいから、単純なプロンプトでは無理かも。
-
名無しさんなら、DeepSeek用にその辺のファインチューン済みモデル待つしかないな。
-
名無しさんまあ、研究段階だし、これから改善されることを期待しよう。
-
名無しさん俺はもう諦めて、出力後に関数で短く整形してる。実際はそれで十分。
-
名無しさんそれも手だね。ポストプロセスで調整するのが現実的か。
-
-
-
投稿者投稿
17件の返信を表示中(うち親返信12件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56