- このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
18件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさん話題になっている DeepSeek R1-0528-Qwen3-8B モデルが応答を止めずに生成し続ける問題についてのスレッドです。: このモデルをローカルで動かしている方、同じ症状は出ていますか?設定やプロンプトの工夫で改善した例などあれば教えてください。
-
名無しさんうちでも同じ問題起きてる。設定変えてもダメだった。
-
名無しさんmax_tokens や stop token をちゃんと設定すれば直るよ。
-
名無しさんそれでもダメだったんだけど、バージョン違いかも?
-
-
名無しさんこのモデル、R1の0528版って結構不安定なイメージ。
-
名無しさん自分はllama.cppでロードしてるけど、途中で止まらない。設定次第?
-
名無しさんllama.cppのバージョンいくつ?自分は古いのかも。
-
名無しさんb4247使ってる。結構新しい方だと思う。
-
-
-
名無しさんプロンプトの最後に「以上」とか入れると止まることがあるって聞いた。
-
名無しさん試したけど、やっぱり長文生成が止まらなかった。
-
-
名無しさんDeepSeek系はよくある問題だよね。V3でも似たような話があった。
-
名無しさん自分はvLLMで動かしてるけど一度も止まらない。環境の問題かも。
-
名無しさんvLLMの方が安定してるのかな。今度試してみる。
-
名無しさんvLLMはメモリ食うけどね。でも確かに安定はしてる。
-
-
-
名無しさんこの問題、開発者が修正パッチ出すって噂あるよ。
-
名無しさん本当?教えて。
-
名無しさんちょっと前のRedditのコメントで見たけど、確かな情報かは不明。
-
-
-
名無しさんとりあえずQwen2.5の7Bに乗り換えた。問題なし。
-
名無しさんそれも手だね。でもR1の性能は捨てがたい。
-
-
-
投稿者投稿
18件の返信を表示中(うち親返信9件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34