DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある？

このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより1年前に更新されました。

20件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年6月24日 10:40 PM #81530 返信
  
  名無しさん
  
  スレッドより。DeepSeekの「deepseek-r1-0528-qwen3-8b」を使っていると、無限にツールを呼び出し続けるループに陥るケースが報告されています。コード生成や推論中に特定のパターンで発生し、モデルの応答が止まらなくなるようです。他のユーザーからはコンテキスト長の制限や温度設定、システムプロンプトの調整など様々なワークアラウンドが提案されていましたが、決定的な解決策はまだ見つかっていない模様。ローカルLLMユーザーならではの悩みどころですね。実際に遭遇した方、何か対策をご存じですか？ッド:
- 2025年6月24日 10:41 PM #81531 返信
  
  名無しさん
  
  自分も同じ問題に遭遇した。ツール呼び出しの回数制限をかけるしかなかったよ。
  - 2025年6月24日 10:49 PM #81533 返信
    
    名無しさん
    
    回数制限って具体的にどうやって設定した？ API側でやったの？
    - 2025年6月24日 10:56 PM #81534 返信
      
      名無しさん
      
      俺はOllamaでmax_tokensとmax_tool_callsを設定したよ。でも根本解決にはならなかった。
- 2025年6月24日 10:44 PM #81532 返信
  
  名無しさん
  
  温度を下げると改善したって話を聞いたけど、うちの環境では効果なかったな。
- 2025年6月24日 10:58 PM #81535 返信
  
  名無しさん
  
  システムプロンプトに「ツールは最大3回まで」と明示したらマシになった人もいるみたい。
  - 2025年6月24日 11:01 PM #81536 返信
    
    名無しさん
    
    それ試してみるわ。うちのQwen3-8Bはコンテキスト長が短いとすぐ暴走する。
    - 2025年6月24日 11:07 PM #81537 返信
      
      名無しさん
      
      コンテキスト長8192だとダメだったから、16384に増やしたら少し落ち着いた。メモリ食うけど。
- 2025年6月24日 11:16 PM #81538 返信
  
  名無しさん
  
  これ、モデル自体のバグじゃないの？ DeepSeek側のファインチューンが粗い気がする。
  - 2025年6月24日 11:18 PM #81539 返信
    
    名無しさん
    
    でも他のモデルでも似たような問題あるから、推論エンジンの問題かも。llama.cppのバージョン変えたら直ったって人居たよ。
    - 2025年6月24日 11:20 PM #81540 返信
      
      名無しさん
      
      llama.cppの最新コミットで修正されたってIssue見た気がする。もう少し待った方がいいかも。
- 2025年6月24日 11:24 PM #81541 返信
  
  名無しさん
  
  自分はツールループ発生時に強制停止してプロンプトを修正してるけど、めんどくさい。
  - 2025年6月24日 11:31 PM #81542 返信
    
    名無しさん
    
    それ、手間だよね。自動で対策するスクリプト書いた人いないのかな。
    - 2025年6月24日 11:42 PM #81543 返信
      
      名無しさん
      
      Pythonで応答を監視して、ループ検出したら別のプロンプトに切り替えるツール作ったよ。需要ある？
      - 2025年6月24日 11:44 PM #81544 返信
        
        名無しさん
        
        ぜひ公開してほしい！ GitHubで見たい。
- 2025年6月24日 11:47 PM #81545 返信
  
  名無しさん
  
  Redditのスレッドでも議論されてたけど、このモデルってR1の蒸留版でしょ？そっちの品質に疑問。
  - 2025年6月24日 11:52 PM #81546 返信
    
    名無しさん
    
    蒸留モデルはこういう変な挙動が出やすいと思う。素のDeepSeek R1じゃ問題起きないって人もいる。
    - 2025年6月24日 11:59 PM #81547 返信
      
      名無しさん
      
      でもサイズ的にQwen3-8Bは手軽だからなあ。VLLMで動かしてるけど、やっぱりループする。
- 2025年6月25日 12:01 AM #81548 返信
  
  名無しさん
  
  とりあえず今はGemma 3の27Bの方が安定してるからそっち使ってる。
  - 2025年6月25日 12:05 AM #81549 返信
    
    名無しさん
    
    確かにGemmaの方がツール系はマシかも。でも日本語性能はDeepSeekの方が上だと思う。
    - 2025年6月25日 12:11 AM #81550 返信
      
      名無しさん
      
      そうそう、日本語のコードコメントとか自然言語だとDeepSeekの方がいいんだよね。困ったもんだ。
投稿者

投稿

20件の返信を表示中（うち親返信7件）

返信先: DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある？

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

AA

タイトルとURLをコピーしました