DeepSeek 3.2がllama.cppサーバーで先頭のthinkタグを食ってしまう現象

掲示板 フォーラム AI DeepSeek 3.2がllama.cppサーバーで先頭のthinkタグを食ってしまう現象

  • このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月、 2週前に更新されました。
18件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #65347 返信
      名無しさん
      話題になっているDeepSeek 3.2のバグについて。llama.cppサーバーで使用すると、出力の先頭にあるべきタグが消えてしまうらしい。これはモデル側の問題か、サーバー実装の問題か議論になっている。他にもDeepSeekモデルのローカル運用、コスト、プライバシー、ベンチマーク比較などの話題も。

    • #65348 返信
      名無しさん
      これ、自分も再現した。タグがないと推論過程が省略されてるみたいで困る。

      • #65350 返信
        名無しさん
        再現したって人結構いるみたいね。DeepSeek側のアップデート待ちかも。

    • #65349 返信
      名無しさん
      llama.cppのバージョンは?自分は最新のnightlyで直った気がする。

      • #65351 返信
        名無しさん
        試してみる。ありがとう。でも他のモデルでは出ないからモデル固有っぽい。

    • #65352 返信
      名無しさん
      DeepSeek 3.2、コーディング性能はいいけどこういう細かいバグがね…

      • #65353 返信
        名無しさん
        でもオープンでここまでできるのはすごいと思う。コスパ最強。

    • #65354 返信
      名無しさん
      プライバシー重視でローカル運用してる身としては、安定性が気になる。

      • #65355 返信
        名無しさん
        その点llama.cppはよく頑張ってる。でもバグ報告はちゃんと上げたほうがいいね。

    • #65356 返信
      名無しさん
      ベンチマークではどうなの?Qwenとかと比べて。

      • #65357 返信
        名無しさん
        自分は数学とコーディングでDeepSeekが優勢だけど、日本語はQwenのほうがいいかも。

        • #65358 返信
          名無しさん
          日本語特化ならやっぱりELYZAとか?でもコスト考えるとDeepSeekは魅力。

    • #65359 返信
      名無しさん
      thinkタグ問題、自分は対策としてプリプロンプトで強制してる。

      • #65360 返信
        名無しさん
        それだと出力が安定する?ちょっと試してみるわ。

    • #65361 返信
      名無しさん
      llama.cppのissueにも上がってる?見てみよう。

      • #65362 返信
        名無しさん
        上がってるよ。でもスルーされてるっぽい。もっと声を上げたほうがいいかも。

    • #65363 返信
      名無しさん
      とりあえずこのスレ参考になる。ありがとう。

    • #65364 返信
      名無しさん
      自分はDeepSeekのコード生成はかなり使えると思ってる。バグさえ直れば最高。

      • #65365 返信
        名無しさん
        確かに。でも最近のアップデートでまた変わったりするから油断できない。

18件の返信を表示中(うち親返信9件)
返信先: DeepSeek 3.2がllama.cppサーバーで先頭のthinkタグを食ってしまう現象で#65352に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました