DeepSeek V3.2がllama.cppでタグを飲み込む問題について

掲示板 フォーラム AI DeepSeek V3.2がllama.cppでタグを飲み込む問題について

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより11ヶ月、 1週前に更新されました。
25件の返信を表示中(うち親返信12件)
  • 投稿者
    投稿
    • #66175 返信
      名無しさん
      Redditで「DeepSeek V3.2がllama.cppサーバー上でタグの冒頭を食べてしまう」という投稿がありました。ローカルLLM運用でこの問題に遭遇した人はいますか?

    • #66176 返信
      名無しさん
      自分もこれに遭遇した。llama.cppの最新ビルドで起こってるみたい。

      • #66177 返信
        名無しさん
        バージョンは?自分はb4377だけど大丈夫だった。

    • #66178 返信
      名無しさん
      これ、推論中にタグが欠けると出力が崩れるから厄介だよな。

      • #66179 返信
        名無しさん
        llama.cppの設定で–no-escapeとか試してみた?

        • #66180 返信
          名無しさん
          試したけど効果なし。どうもトークナイザーの問題っぽい。

    • #66181 返信
      名無しさん
      DeepSeek V3.2ってv3.1からそんなに変わってないと思うけど、このバグはv3.2固有なの?

      • #66182 返信
        名無しさん
        v3.1では出なかった。おそらく新しいトークナイザーに原因がある。

    • #66183 返信
      名無しさん
      Ollama経由だとどう?llama.cppのサーバーモードだけの問題?

      • #66184 返信
        名無しさん
        Ollamaでも同じ現象を確認した。バックエンドが同じだからね。

    • #66185 返信
      名無しさん
      緊急回避として、プロンプトに改行入れたら直ったって聞いたけど。

      • #66186 返信
        名無しさん
        それ試したら確かに改善した。でも根本解決じゃないよな。

    • #66187 返信
      名無しさん
      llama.cppのGitHubでissueが立ってる?まだなら報告した方がいい。

      • #66188 返信
        名無しさん
        調べたけど同じissue見つからなかった。自分で立てようかな。

    • #66189 返信
      名無しさん
      DeepSeekの公式はあまり気にしてなさそう。ローカル勢はマイノリティだからな。

      • #66190 返信
        名無しさん
        それ言うと悲しくなる。APIは高いし、ローカルで動かしたいのに。

    • #66191 返信
      名無しさん
      自分はとりあえずv3.1にロールバックした。しばらく様子見。

      • #66192 返信
        名無しさん
        v3.1でも性能十分だし、バグに悩むより安定重視でいいかも。

    • #66193 返信
      名無しさん
      llama.cppの代わりにKoboldCPPだとどう?試した人いる?

      • #66194 返信
        名無しさん
        KoboldCPPでは問題起きてない。内部のトークナイザー処理が違うのかも。

    • #66195 返信
      名無しさん
      結局、タグ使わずに出力させれば回避できるよね。

      • #66196 返信
        名無しさん
        でもそれだと推論の過程が見えなくなるから、あんまり意味ない。

    • #66197 返信
      名無しさん
      もしかしたら–grammarオプションでタグを強制すれば直るかも。

      • #66198 返信
        名無しさん
        それ試したけど、文法が複雑すぎて逆に出力がおかしくなった。

    • #66199 返信
      名無しさん
      Redditのも対策がまとまってきてるらしい。参考にしよう。

      • #66200 返信
        名無しさん
        情報ありがとう。自分もそっち見てみる。

25件の返信を表示中(うち親返信12件)
返信先: DeepSeek V3.2がllama.cppでタグを飲み込む問題についてで#66195に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました