DeepSeek R1-0528-Qwen3-8B が応答を止めない問題

掲示板 フォーラム AI DeepSeek R1-0528-Qwen3-8B が応答を止めない問題

  • このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
18件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #69165 返信
      名無しさん
      Reddit r/LocalLLaMA で話題になっている DeepSeek R1-0528-Qwen3-8B モデルが応答を止めずに生成し続ける問題についてのスレッドです。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1r4rm3w/deepseekr10528qwen38b_dosent_stop_responding/ このモデルをローカルで動かしている方、同じ症状は出ていますか?設定やプロンプトの工夫で改善した例などあれば教えてください。

    • #69166 返信
      名無しさん
      うちでも同じ問題起きてる。設定変えてもダメだった。

    • #69167 返信
      名無しさん
      max_tokens や stop token をちゃんと設定すれば直るよ。

      • #69168 返信
        名無しさん
        それでもダメだったんだけど、バージョン違いかも?

    • #69169 返信
      名無しさん
      このモデル、R1の0528版って結構不安定なイメージ。

    • #69170 返信
      名無しさん
      自分はllama.cppでロードしてるけど、途中で止まらない。設定次第?

      • #69171 返信
        名無しさん
        llama.cppのバージョンいくつ?自分は古いのかも。

        • #69172 返信
          名無しさん
          b4247使ってる。結構新しい方だと思う。

    • #69173 返信
      名無しさん
      プロンプトの最後に「以上」とか入れると止まることがあるって聞いた。

      • #69174 返信
        名無しさん
        試したけど、やっぱり長文生成が止まらなかった。

    • #69175 返信
      名無しさん
      DeepSeek系はよくある問題だよね。V3でも似たような話があった。

    • #69176 返信
      名無しさん
      自分はvLLMで動かしてるけど一度も止まらない。環境の問題かも。

      • #69177 返信
        名無しさん
        vLLMの方が安定してるのかな。今度試してみる。

        • #69178 返信
          名無しさん
          vLLMはメモリ食うけどね。でも確かに安定はしてる。

    • #69179 返信
      名無しさん
      この問題、開発者が修正パッチ出すって噂あるよ。

      • #69180 返信
        名無しさん
        本当?ソース教えて。

        • #69181 返信
          名無しさん
          ちょっと前のRedditのコメントで見たけど、確かな情報かは不明。

    • #69182 返信
      名無しさん
      とりあえずQwen2.5の7Bに乗り換えた。問題なし。

      • #69183 返信
        名無しさん
        それも手だね。でもR1の性能は捨てがたい。

18件の返信を表示中(うち親返信9件)
返信先: DeepSeek R1-0528-Qwen3-8B が応答を止めない問題で#69178に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました