- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより9ヶ月、 3週前に更新されました。
26件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「DeepSeek V3.1の思考表示(thinking)を無効にする方法」という質問が話題になってました。APIで使うと余計な思考が出力されて邪魔だとか、ローカルで動かすときにリを節約したいとか。実際に設定方法を知りたい人も多いみたいです。
-
名無しさんそもそも思考表示って何? DeepSeekのモデルが内部で考えた過程を出力するやつ?
-
名無しさんそう、モデルが推論するときの思考チェーンみたいなもの。APIだとデフォルトで出てくるらしい。
-
-
名無しさんオフにする方法は、APIのパラメータに「thinking=false」とか追加すればいいんじゃない? 公式ドキュメントに書いてあるかも。
-
名無しさん試してみたけど、それだけじゃダメだった。モデルによってパラメータ名が違うみたい。
-
-
名無しさんローカルで動かす場合、transformersの設定でoutput_hidden_statesとかを弄る必要があるらしい。よくわからん。
-
名無しさんそれ、思考表示とは別の話じゃない? 思考表示は推論過程のテキスト出力のことだよ。
-
名無しさんああ、そうか。だとするとAPIのレスポンスから思考部分を削除するしかないのかな。
-
-
-
名無しさん個人的には思考表示があったほうが便利だと思うけど、コード生成とかだと邪魔なんだろうな。
-
名無しさんそうそう、コードだけ欲しいのに「まずは問題を分析します」とか書かれるとウザい。
-
名無しさんでも思考表示があるとモデルがどう考えてるかわかって面白いよ。たまに変な思考してるし。
-
-
-
名無しさんDeepSeek V3.1は結構コストパフォーマンスいいらしいけど、思考表示のせいでトークン消費が増えるのが難点。
-
名無しさん確かに。APIだと思考表示分の料金もかかるから、大量に使う人はオフにしたいよね。
-
名無しさんClaudeとかだとそもそも思考表示がないから、そういう意味では安心。
-
名無しさんClaudeは思考を隠してるだけで、内部的にはやってるらしいよ。まあ見えない方が気にならないけど。
-
-
-
-
名無しさんローカルで動かすときに思考表示をオフにしたいんだけど、GGUFフォーマットだと設定変えられるのかな?
-
名無しさんllama.cppのオプションにそれっぽいのあった気がする。–no-thinkとか。
-
名無しさん本当? 今度試してみる。ありがとう。
-
名無しさんllama.cppのバージョンによってオプション名が違うかも。最新のコミットログ見たほうがいい。
-
-
-
-
名無しさんHugging Faceのモデルカードに書いてあるかもしれない。自分の環境だとデフォルトで出なかったけど。
-
名無しさんそれはAPIのエンドポイントが違うんじゃない? チャット用と完了用で挙動が異なるって聞いた。
-
名無しさんなるほど。chat completionsだと思考表示が出て、completionsだと出ないとか?
-
-
-
名無しさん思考表示をオフにするとモデルの精度が落ちるって話も聞いたけど、本当かな?
-
名無しさん自分で試した範囲では変わらなかった。思考表示はあくまで補助的な情報で、出力自体には影響しないと思う。
-
名無しさんでもモデルによっては思考を指示に含めて学習してる可能性もあるから、一概には言えないかも。
-
-
-
名無しさんとりあえず公式のサンプルコードを確認するのが一番確実そうだね。
-
名無しさんこのスレ参考になるわ。俺も試してみる。ありがとう。
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信9件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01