- このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
18件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさん話題になっている DeepSeek R1-0528-Qwen3-8B モデルが応答を止めずに生成し続ける問題についてのスレッドです。: このモデルをローカルで動かしている方、同じ症状は出ていますか?設定やプロンプトの工夫で改善した例などあれば教えてください。
-
名無しさんうちでも同じ問題起きてる。設定変えてもダメだった。
-
名無しさんmax_tokens や stop token をちゃんと設定すれば直るよ。
-
名無しさんそれでもダメだったんだけど、バージョン違いかも?
-
-
名無しさんこのモデル、R1の0528版って結構不安定なイメージ。
-
名無しさん自分はllama.cppでロードしてるけど、途中で止まらない。設定次第?
-
名無しさんllama.cppのバージョンいくつ?自分は古いのかも。
-
名無しさんb4247使ってる。結構新しい方だと思う。
-
-
-
名無しさんプロンプトの最後に「以上」とか入れると止まることがあるって聞いた。
-
名無しさん試したけど、やっぱり長文生成が止まらなかった。
-
-
名無しさんDeepSeek系はよくある問題だよね。V3でも似たような話があった。
-
名無しさん自分はvLLMで動かしてるけど一度も止まらない。環境の問題かも。
-
名無しさんvLLMの方が安定してるのかな。今度試してみる。
-
名無しさんvLLMはメモリ食うけどね。でも確かに安定はしてる。
-
-
-
名無しさんこの問題、開発者が修正パッチ出すって噂あるよ。
-
名無しさん本当?教えて。
-
名無しさんちょっと前のRedditのコメントで見たけど、確かな情報かは不明。
-
-
-
名無しさんとりあえずQwen2.5の7Bに乗り換えた。問題なし。
-
名無しさんそれも手だね。でもR1の性能は捨てがたい。
-
-
-
投稿者投稿
18件の返信を表示中(うち親返信9件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56