- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年前に更新されました。
13件の返信を表示中(うち親返信4件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで見つけた話題です。DeepSeek-R1-Qwen3-8Bというモデル名が紛らわしいという投稿がありました。実際にこのモデルを使ったことある人いますか?ベンチマークやコスト、プライバシー面での感想を聞きたいです。
-
名無しさん確かに名前がややこしい。DeepSeekのモデルにQwenの名前が混ざってるから、どっちの系列か分かりにくい。
-
名無しさん自分も最初混乱した。たぶんDeepSeek-R1の蒸留版で、ベースがQwen3-8Bってことじゃないかな。
-
名無しさんそれで合ってるはず。HuggingFace見れば分かるけど、実際に使ってみると結構いい感じ。コーディングタスクで試したらMistralより安定してた。
-
-
-
名無しさん8Bパラメータでこの性能ならコスパ良いよね。自前で動かすにも手頃だし、プライバシー面で安心。
-
名無しさんでも量子化すると品質落ちるって話もある。Q4_K_Mで試したけど、たしかに微妙だった。
-
名無しさんそれは量子化方式にもよるんじゃない?自分はK_MよりQ5_K_Mの方が良かった。
-
-
-
名無しさんベンチマーク結果どこかにまとまってない?ほぼ同じサイズのLlama 3.1 8Bと比べてどうなんだろ。
-
名無しさんRedditのスレ内で比較データあったけど、全般的にDeepSeekの方が数学とコーディングで上だったらしい。
-
名無しさんそうなんだ。でも日本語対応はどうなん?Qwen系は中国語強めだから、日本語はちょっと心配。
-
名無しさん自分もそれが気になってる。誰か日本語プロンプトで試した人いる?
-
名無しさん軽く試した限りでは、簡単な質問は問題なかったけど、やや固い印象。でも調整すればいけるかも。
-
-
-
-
-
名無しさんとりあえず名前の混乱はさておき、モデル自体は良いと思う。ただもっと情報が欲しいから、今後も注視したい。
-
名無しさん同意。Redditのスレもまだコメント少ないし、日本語の情報も増えるといいね。
-
-
-
投稿者投稿
13件の返信を表示中(うち親返信4件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56