- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
26件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんスレッド「DeepSeek V3.2 ignores post-history system instructions when conversation history has strong narrative momentum」の話題です。
要約:長い会話の流れがあると、システムプロンプトやポストヒストリーの指示を無視してしまう現象が報告されています。特に物語の勢いが強いと顕著とのこと。同じ症状が出た方はいますか? -
名無しさん自分もV3.2で同じ現象起きてる。特に長文のロールプレイ中にシステム指示を無視するようになる。
-
名無しさんそうそう。最初はちゃんと守ってるのに、10往復くらいすると平気で無視し始める。
-
名無しさんそれってシステムプロンプトを会話の途中で再挿入すれば直るのかな?
-
-
-
名無しさん会話のコンテキストウィンドウが長くなると、最初の方の指示が薄れるってこと?
-
名無しさんDeepSeekのAPI使ってるけど、このバグは結構致命的だと思う。
-
名無しさんローカルで動かしてるけど、設定を少し変えたら改善した気がする。
-
-
名無しさんV3.1ではそんなことなかったのに、アップデートで退化した感じ。
-
名無しさん確かにV3.1の方が安定してた。V3.2は生成速度は速いけど品質が不安定。
-
-
名無しさんこれってモデル側の問題?それともAPIサーバーの実装の問題?
-
名無しさん両方かも。ローカルでも起こるからモデルの注意力の問題だと思う。
-
名無しさん注意力って言うと、長いコンテキストでの位置バイアスかな?
-
名無しさんそう。スレッドの元記事でもnarrative momentumって書いてあったけど、会話の流れに引っ張られてるんだろうね。
-
-
-
-
名無しさんとりあえず今はシステムプロンプトを短くして、会話の途中で何度か再送信する運用にしてる。
-
名無しさんそれだと手間だよね。自動で再挿入するスクリプト書こうかな。
-
名無しさんそれ良いアイデア。自分も作ってみる。
-
-
-
名無しさんRedditのコメント見ると、他のモデルでも似たような報告あるみたい。
-
名無しさんClaudeとかGPTでも長い会話だと注意が散ることはあるけど、DeepSeekは特に顕著かも。
-
-
名無しさん自分はまだV3.2試してないけど、V3.1からそのまま使ってる。アップデートしない方がいい?
-
名無しさん用途による。コーディングとか単発の質問ならV3.2の方が速いけど、長い対話はV3.1の方が安心。
-
名無しさんなるほど。自分も様子見しよう。
-
-
-
名無しさんDeepSeekってこういうバグ放置しがちだから、次のアップデートで直るか怪しい。
-
名無しさんOSSだからコミュニティでパッチ当てられるけど、公式の改善は遅いよね。
-
名無しさんそれでも他のクローズドなモデルよりはマシ。自分でカスタマイズできるし。
-
-
-
名無しさんとにかく再現性あるから、バグレポート出した方がいいね。
-
名無しさん既にGitHubにissueあるよ。英語だけど。
-
名無しさんじゃあ日本語でも書いてみようかな。同じ現象の人が増えるといいけど。
-
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信10件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56