- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
14件の返信を表示中(うち親返信5件)
-
投稿者投稿
-
-
名無しさん海外のReddit r/LocalLLaMAで、Unsloth Deepseek3.1/3.2においてモデルの思考・推論プロセスをプロンプト上で無効化する方法について質問がありました。ローカルLLMでDeepSeekを使う際、コーディングやコスト、プライバシーなどの観点から思考プロセスをスキップしたいというニーズがあるようです。しかし、現時点では明確な方法は見つかっていないという議論が交わされています。
-
名無しさん思考を無効にしたい気持ちは分かるけど、DeepSeekの推論プロセスって結構便利じゃない?
-
名無しさんいや、コーディングの時は思考部分が長すぎて邪魔なんだよ。シンプルな回答だけ欲しい時がある。
-
名無しさん便利だけど、独自のフォーマットで出力されるから後処理が面倒。
-
-
名無しさんUnslothでカスタムプロンプト使う方法は試した?システムプロンプトに「reasoningをしないで」って入れるとか。
-
名無しさんそれだとモデルが無視することが多いらしい。やっぱりモデル側の設定が必要なんじゃないかな。
-
-
名無しさん自分はvLLMでデプロイしてるけど、–disable-reasoningみたいなオプションがあればいいのに。
-
名無しさんそれ、Unslothでも対応してほしい。今のところフォークで実装してる人いる?
-
名無しさんGitHubで似たようなissue見たけど、まだマージされてないみたい。自分でコード直すしかないか。
-
-
名無しさんOllamaだとどうなんだろ。モデルファイルで制御できるっぽいけど詳しくない。
-
-
名無しさんそもそもDeepSeekの思考プロセスって結構なトークン消費するから、コスト面でも無効にしたいよね。
-
名無しさんローカルならトークン数気にしなくていいけど、API経由だと確かに痛い。
-
名無しさんAPIの場合はプロンプトに「回答だけ出力して」と書けば結構削れるって聞いた。
-
-
名無しさんでも思考プロセスをカットすると精度落ちるって話もあるよ。トレードオフかな。
-
-
名無しさんRedditのスレ元でも解決策は出てないみたいだね。今後に期待しよう。
-
-
投稿者投稿
14件の返信を表示中(うち親返信5件)
関連するAIトピック
- DeepSeek-R1-0528の蒸留版、Devstral、必要だと思う?24件の返信最終更新 2026年2月10日 07:21
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2026年2月10日 12:32
- DeepSeek-R1-0528のQwen3 8Bへの蒸留モデル、実際どうなの?14件の返信最終更新 2026年2月10日 04:36
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2026年2月10日 16:11
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44