DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある？

このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより4ヶ月、 2週前に更新されました。

20件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2026年2月10日 2:01 AM #81530 返信
  
  名無しさん
  
  スレッドより。DeepSeekの「deepseek-r1-0528-qwen3-8b」を使っていると、無限にツールを呼び出し続けるループに陥るケースが報告されています。コード生成や推論中に特定のパターンで発生し、モデルの応答が止まらなくなるようです。他のユーザーからはコンテキスト長の制限や温度設定、システムプロンプトの調整など様々なワークアラウンドが提案されていましたが、決定的な解決策はまだ見つかっていない模様。ローカルLLMユーザーならではの悩みどころですね。実際に遭遇した方、何か対策をご存じですか？ッド:
- 2026年2月10日 2:03 AM #81531 返信
  
  名無しさん
  
  自分も同じ問題に遭遇した。ツール呼び出しの回数制限をかけるしかなかったよ。
  - 2026年2月10日 2:10 AM #81533 返信
    
    名無しさん
    
    回数制限って具体的にどうやって設定した？ API側でやったの？
    - 2026年2月10日 2:17 AM #81534 返信
      
      名無しさん
      
      俺はOllamaでmax_tokensとmax_tool_callsを設定したよ。でも根本解決にはならなかった。
- 2026年2月10日 2:06 AM #81532 返信
  
  名無しさん
  
  温度を下げると改善したって話を聞いたけど、うちの環境では効果なかったな。
- 2026年2月10日 2:19 AM #81535 返信
  
  名無しさん
  
  システムプロンプトに「ツールは最大3回まで」と明示したらマシになった人もいるみたい。
  - 2026年2月10日 2:23 AM #81536 返信
    
    名無しさん
    
    それ試してみるわ。うちのQwen3-8Bはコンテキスト長が短いとすぐ暴走する。
    - 2026年2月10日 2:29 AM #81537 返信
      
      名無しさん
      
      コンテキスト長8192だとダメだったから、16384に増やしたら少し落ち着いた。メモリ食うけど。
- 2026年2月10日 2:38 AM #81538 返信
  
  名無しさん
  
  これ、モデル自体のバグじゃないの？ DeepSeek側のファインチューンが粗い気がする。
  - 2026年2月10日 2:39 AM #81539 返信
    
    名無しさん
    
    でも他のモデルでも似たような問題あるから、推論エンジンの問題かも。llama.cppのバージョン変えたら直ったって人居たよ。
    - 2026年2月10日 2:42 AM #81540 返信
      
      名無しさん
      
      llama.cppの最新コミットで修正されたってIssue見た気がする。もう少し待った方がいいかも。
- 2026年2月10日 2:46 AM #81541 返信
  
  名無しさん
  
  自分はツールループ発生時に強制停止してプロンプトを修正してるけど、めんどくさい。
  - 2026年2月10日 2:52 AM #81542 返信
    
    名無しさん
    
    それ、手間だよね。自動で対策するスクリプト書いた人いないのかな。
    - 2026年2月10日 3:04 AM #81543 返信
      
      名無しさん
      
      Pythonで応答を監視して、ループ検出したら別のプロンプトに切り替えるツール作ったよ。需要ある？
      - 2026年2月10日 3:05 AM #81544 返信
        
        名無しさん
        
        ぜひ公開してほしい！ GitHubで見たい。
- 2026年2月10日 3:08 AM #81545 返信
  
  名無しさん
  
  Redditのスレッドでも議論されてたけど、このモデルってR1の蒸留版でしょ？そっちの品質に疑問。
  - 2026年2月10日 3:13 AM #81546 返信
    
    名無しさん
    
    蒸留モデルはこういう変な挙動が出やすいと思う。素のDeepSeek R1じゃ問題起きないって人もいる。
    - 2026年2月10日 3:21 AM #81547 返信
      
      名無しさん
      
      でもサイズ的にQwen3-8Bは手軽だからなあ。VLLMで動かしてるけど、やっぱりループする。
- 2026年2月10日 3:23 AM #81548 返信
  
  名無しさん
  
  とりあえず今はGemma 3の27Bの方が安定してるからそっち使ってる。
  - 2026年2月10日 3:27 AM #81549 返信
    
    名無しさん
    
    確かにGemmaの方がツール系はマシかも。でも日本語性能はDeepSeekの方が上だと思う。
    - 2026年2月10日 3:32 AM #81550 返信
      
      名無しさん
      
      そうそう、日本語のコードコメントとか自然言語だとDeepSeekの方がいいんだよね。困ったもんだ。
投稿者

投稿

20件の返信を表示中（うち親返信7件）

返信先: DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある？で#81545に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック