DeepSeek-V3.2のGGUF版でタグが消える問題

名無しさん · 2025-03-11T09:22:52+09:00

/投稿された DeepSeek-V3.2 の Unsloth GGUF モデルを llama-server で動かした際、Open WebUI 上で先頭のタグが欠落するという報告をまとめました。モデル自体は動作するが、思考プロセスが表示されないためデバッグに困っているとのこと。ローカルLLMのファインチューニングや推論周りの細かい挙動に詳しい方、同様の経験がある方の意見を聞きたいです。

このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。

17件の返信を表示中（うち親返信9件）

投稿者

投稿
- 2025年3月11日 9:22 AM #65311 返信
  
  名無しさん
  
  /投稿された DeepSeek-V3.2 の Unsloth GGUF モデルを llama-server で動かした際、Open WebUI 上で先頭のタグが欠落するという報告をまとめました。モデル自体は動作するが、思考プロセスが表示されないためデバッグに困っているとのこと。ローカルLLMのファインチューニングや推論周りの細かい挙動に詳しい方、同様の経験がある方の意見を聞きたいです。
- 2025年3月11日 9:24 AM #65312 返信
  
  名無しさん
  
  自分も全く同じ現象が出てた。llama-server のパラメータか何かで制御できるのかな？
  - 2025年3月11日 9:27 AM #65313 返信
    
    名無しさん
    
    タグが消えるのはUnslothのGGUF変換時の問題かもしれない。変換オプションを見直してみると良いかも。
- 2025年3月11日 9:31 AM #65314 返信
  
  名無しさん
  
  DeepSeekのR1系はが重要だから、これは致命的だね。Open WebUI側のフォーマット設定も疑ってみるべき。
  - 2025年3月11日 9:38 AM #65315 返信
    
    名無しさん
    
    Open WebUIのテンプレート機能で強制的にを挿入するスクリプトを書いて回避してる。いまいちだけどとりあえず動く。
- 2025年3月11日 9:40 AM #65316 返信
  
  名無しさん
  
  そういえばllama.cppの最近のコミットで関連の修正が入ってたような。バージョンアップ試した？
  - 2025年3月11日 9:44 AM #65317 返信
    
    名無しさん
    
    最新のllama.cppにアップデートしたら直ったよ。ただしほかにも互換性問題が出たけど。
- 2025年3月11日 9:50 AM #65318 返信
  
  名無しさん
  
  GGUFじゃなくて元のHugging Faceモデルから直接使うほうが安定してるんじゃないかな。サイズは大きいけど。
  - 2025年3月11日 9:59 AM #65319 返信
    
    名無しさん
    
    メモリ制限があるからGGUFじゃないと厳しいんだよね。量子化も含めて簡単なのが良い。
- 2025年3月11日 10:00 AM #65320 返信
  
  名無しさん
  
  UnslothのGGUF変換って結構特殊なオプションが多くて、デフォルトだと変なことになることがある。自分は–add-bos-tokenとか試してみてる。
  - 2025年3月11日 10:03 AM #65321 返信
    
    名無しさん
    
    あ、それ効くかも。タグはBOSの後にあるから、BOSトークンが原因で消えてる可能性。
- 2025年3月11日 10:07 AM #65322 返信
  
  名無しさん
  
  この問題、自分も遭遇して結局llama-serverをやめてvLLMに乗り換えた。vLLMなら問題なし。
  - 2025年3月11日 10:13 AM #65324 返信
    
    名無しさん
    
    vLLMはGPUメモリ多く食うからなあ。でも安定性重視ならありかも。
- 2025年3月11日 10:25 AM #65325 返信
  
  名無しさん
  
  皆さんどんな量子化ビット使ってる？自分はQ4_K_Mでやってるけど、の有無に関わらず回答品質は悪くない。
  - 2025年3月11日 10:27 AM #65326 返信
    
    名無しさん
    
    Q8_0のほうが思考がはっきり出る気がする。ただしサイズ2倍。トレードオフ。
- 2025年3月11日 10:29 AM #65328 返信
  
  名無しさん
  
  ローカルでDeepSeekを動かすなら、素直に公式のollama使うのが楽。GGUFだとハマりポイント多い。
  - 2025年3月11日 10:34 AM #65330 返信
    
    名無しさん
    
    ollamaもバージョンによっては同じ問題あったよ。モデル側の問題かもしれん。
- 2025年3月11日 10:42 AM #65332 返信
  
  名無しさん
  
  結局、llama-serverの–no-escape-special-tokens オプションで直ったって話をどこかで見た。試す価値あり。
投稿者

投稿

17件の返信を表示中（うち親返信9件）

返信先: DeepSeek-V3.2のGGUF版でタグが消える問題で#65315に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック