DeepSeek V3.1の思考表示をオフにする方法

掲示板 フォーラム AI DeepSeek V3.1の思考表示をオフにする方法

  • このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより1年、 1ヶ月前に更新されました。
26件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #73783 返信
      名無しさん
      Redditのr/LocalLLaMAで「DeepSeek V3.1の思考表示(thinking)を無効にする方法」という質問が話題になってました。APIで使うと余計な思考が出力されて邪魔だとか、ローカルで動かすときにリを節約したいとか。実際に設定方法を知りたい人も多いみたいです。

    • #73784 返信
      名無しさん
      そもそも思考表示って何? DeepSeekのモデルが内部で考えた過程を出力するやつ?

      • #73785 返信
        名無しさん
        そう、モデルが推論するときの思考チェーンみたいなもの。APIだとデフォルトで出てくるらしい。

    • #73786 返信
      名無しさん
      オフにする方法は、APIのパラメータに「thinking=false」とか追加すればいいんじゃない? 公式ドキュメントに書いてあるかも。

      • #73787 返信
        名無しさん
        試してみたけど、それだけじゃダメだった。モデルによってパラメータ名が違うみたい。

    • #73788 返信
      名無しさん
      ローカルで動かす場合、transformersの設定でoutput_hidden_statesとかを弄る必要があるらしい。よくわからん。

      • #73789 返信
        名無しさん
        それ、思考表示とは別の話じゃない? 思考表示は推論過程のテキスト出力のことだよ。

        • #73790 返信
          名無しさん
          ああ、そうか。だとするとAPIのレスポンスから思考部分を削除するしかないのかな。

    • #73791 返信
      名無しさん
      個人的には思考表示があったほうが便利だと思うけど、コード生成とかだと邪魔なんだろうな。

      • #73792 返信
        名無しさん
        そうそう、コードだけ欲しいのに「まずは問題を分析します」とか書かれるとウザい。

        • #73793 返信
          名無しさん
          でも思考表示があるとモデルがどう考えてるかわかって面白いよ。たまに変な思考してるし。

    • #73794 返信
      名無しさん
      DeepSeek V3.1は結構コストパフォーマンスいいらしいけど、思考表示のせいでトークン消費が増えるのが難点。

      • #73795 返信
        名無しさん
        確かに。APIだと思考表示分の料金もかかるから、大量に使う人はオフにしたいよね。

        • #73796 返信
          名無しさん
          Claudeとかだとそもそも思考表示がないから、そういう意味では安心。

          • #73797 返信
            名無しさん
            Claudeは思考を隠してるだけで、内部的にはやってるらしいよ。まあ見えない方が気にならないけど。

    • #73798 返信
      名無しさん
      ローカルで動かすときに思考表示をオフにしたいんだけど、GGUFフォーマットだと設定変えられるのかな?

      • #73799 返信
        名無しさん
        llama.cppのオプションにそれっぽいのあった気がする。–no-thinkとか。

        • #73800 返信
          名無しさん
          本当? 今度試してみる。ありがとう。

          • #73801 返信
            名無しさん
            llama.cppのバージョンによってオプション名が違うかも。最新のコミットログ見たほうがいい。

    • #73802 返信
      名無しさん
      Hugging Faceのモデルカードに書いてあるかもしれない。自分の環境だとデフォルトで出なかったけど。

      • #73803 返信
        名無しさん
        それはAPIのエンドポイントが違うんじゃない? チャット用と完了用で挙動が異なるって聞いた。

        • #73804 返信
          名無しさん
          なるほど。chat completionsだと思考表示が出て、completionsだと出ないとか?

    • #73805 返信
      名無しさん
      思考表示をオフにするとモデルの精度が落ちるって話も聞いたけど、本当かな?

      • #73806 返信
        名無しさん
        自分で試した範囲では変わらなかった。思考表示はあくまで補助的な情報で、出力自体には影響しないと思う。

        • #73807 返信
          名無しさん
          でもモデルによっては思考を指示に含めて学習してる可能性もあるから、一概には言えないかも。

    • #73808 返信
      名無しさん
      とりあえず公式のサンプルコードを確認するのが一番確実そうだね。

      • #73809 返信
        名無しさん
        このスレ参考になるわ。俺も試してみる。ありがとう。

26件の返信を表示中(うち親返信9件)
返信先: DeepSeek V3.1の思考表示をオフにする方法で#73809に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました