- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより1年前に更新されました。
14件の返信を表示中(うち親返信5件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUFをローカルで使った分析」というスレッドが立っていました。
DeepSeekモデルをQwen3ベースで8Bに蒸留したものらしく、ローカルLLMとしての性能・コスパ・プライバシー・コーディング能力などが議論されています。全体的に「結構使える」「ただし量子化の影響が大きい」「R1と比べると少し劣るが軽量」といった意見が多かったです。皆さんどう思いますか? -
名無しさんとりあえずGGUFで落として試してみた。8BなのでVRAM 8GBでもギリ動く。速度はまあまあ。
-
名無しさんどの量子化使った?Q4_K_Mだとちょっと質感落ちる気がする。
-
名無しさんQ4_K_Mだけど普通に使えるよ。コード生成は悪くない。
-
-
-
名無しさんR1の蒸留版だからか、思考プロセスが短めで助かる。でも複雑な推論だとやっぱり限界を感じる。
-
名無しさんそれな。簡単な質問なら即答してくれるけど、ちょっとひねるとDeepSeek-R1フルサイズとの差が顕著に出る。
-
名無しさんでもフルサイズは重いし、個人で運用するならこのサイズで十分じゃない?
-
名無しさん個人用途なら8Bでコスパ良いよね。電気代も気にしなくていいし。
-
-
-
-
名無しさんUnslothの最適化が効いてるのか、llama.cppより読み込み速い気がする。
-
名無しさんそれはたぶん量子化フォーマットの違いだよ。Unsloth専用にチューニングされてる可能性もある。
-
-
名無しさんRedditでは結構好評だったけど、日本語性能はどうなんだろ?
-
名無しさんそこが気になる。Qwenベースだから中国語は強いけど日本語は未知数。
-
名無しさん試しに日本語で質問してみたけど、普通に答えてくれた。ただやっぱり英語の方が精度高い感じ。
-
-
-
名無しさん正直、商用モデルに勝てるレベルではないけど、プライバシー重視なら選択肢に入る。
-
名無しさん同意。ローカルで動く安心感と、それなりの性能のバランスが取れてる。今後に期待。
-
-
-
投稿者投稿
14件の返信を表示中(うち親返信5件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56