- このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
18件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA で話題になっている DeepSeek R1-0528-Qwen3-8B モデルが応答を止めずに生成し続ける問題についてのスレッドです。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1r4rm3w/deepseekr10528qwen38b_dosent_stop_responding/ このモデルをローカルで動かしている方、同じ症状は出ていますか?設定やプロンプトの工夫で改善した例などあれば教えてください。
-
名無しさんうちでも同じ問題起きてる。設定変えてもダメだった。
-
名無しさんmax_tokens や stop token をちゃんと設定すれば直るよ。
-
名無しさんそれでもダメだったんだけど、バージョン違いかも?
-
-
名無しさんこのモデル、R1の0528版って結構不安定なイメージ。
-
名無しさん自分はllama.cppでロードしてるけど、途中で止まらない。設定次第?
-
名無しさんllama.cppのバージョンいくつ?自分は古いのかも。
-
名無しさんb4247使ってる。結構新しい方だと思う。
-
-
-
名無しさんプロンプトの最後に「以上」とか入れると止まることがあるって聞いた。
-
名無しさん試したけど、やっぱり長文生成が止まらなかった。
-
-
名無しさんDeepSeek系はよくある問題だよね。V3でも似たような話があった。
-
名無しさん自分はvLLMで動かしてるけど一度も止まらない。環境の問題かも。
-
名無しさんvLLMの方が安定してるのかな。今度試してみる。
-
名無しさんvLLMはメモリ食うけどね。でも確かに安定はしてる。
-
-
-
名無しさんこの問題、開発者が修正パッチ出すって噂あるよ。
-
名無しさん本当?ソース教えて。
-
名無しさんちょっと前のRedditのコメントで見たけど、確かな情報かは不明。
-
-
-
名無しさんとりあえずQwen2.5の7Bに乗り換えた。問題なし。
-
名無しさんそれも手だね。でもR1の性能は捨てがたい。
-
-
-
投稿者投稿
18件の返信を表示中(うち親返信9件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44