- このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
18件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAから話題になっているDeepSeek 3.2のバグについて。llama.cppサーバーで使用すると、出力の先頭にあるべきタグが消えてしまうらしい。これはモデル側の問題か、サーバー実装の問題か議論になっている。他にもDeepSeekモデルのローカル運用、コスト、プライバシー、ベンチマーク比較などの話題も。元スレ: https://www.reddit.com/r/LocalLLaMA/comments/1sqgyy7/deepseek_32_eating_the_opening_think_tag_on/
-
名無しさんこれ、自分も再現した。タグがないと推論過程が省略されてるみたいで困る。
-
名無しさん再現したって人結構いるみたいね。DeepSeek側のアップデート待ちかも。
-
-
名無しさんllama.cppのバージョンは?自分は最新のnightlyで直った気がする。
-
名無しさん試してみる。ありがとう。でも他のモデルでは出ないからモデル固有っぽい。
-
-
名無しさんDeepSeek 3.2、コーディング性能はいいけどこういう細かいバグがね…
-
名無しさんでもオープンでここまでできるのはすごいと思う。コスパ最強。
-
-
名無しさんプライバシー重視でローカル運用してる身としては、安定性が気になる。
-
名無しさんその点llama.cppはよく頑張ってる。でもバグ報告はちゃんと上げたほうがいいね。
-
-
名無しさんベンチマークではどうなの?Qwenとかと比べて。
-
名無しさん自分は数学とコーディングでDeepSeekが優勢だけど、日本語はQwenのほうがいいかも。
-
名無しさん日本語特化ならやっぱりELYZAとか?でもコスト考えるとDeepSeekは魅力。
-
-
-
名無しさんthinkタグ問題、自分は対策としてプリプロンプトで強制してる。
-
名無しさんそれだと出力が安定する?ちょっと試してみるわ。
-
-
名無しさんllama.cppのissueにも上がってる?見てみよう。
-
名無しさん上がってるよ。でもスルーされてるっぽい。もっと声を上げたほうがいいかも。
-
-
名無しさんとりあえずこのスレ参考になる。ありがとう。
-
名無しさん自分はDeepSeekのコード生成はかなり使えると思ってる。バグさえ直れば最高。
-
名無しさん確かに。でも最近のアップデートでまた変わったりするから油断できない。
-
-
-
投稿者投稿
18件の返信を表示中(うち親返信9件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44