- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより1年前に更新されました。
14件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさん話題のDeepSeek-R1-0528をQwen3 8Bに蒸留したモデルについてのスレッドです。:。ローカルLLMのコスト、プライバシー、コーディング性能、ベンチマーク比較など様々な意見があります。皆さんはどう思いますか?
-
名無しさんこれ、Qwen3 8Bベースだとメモリ消費が少なくて良さそう。自宅のMacBookでも動くかな。
-
名無しさんMacBook M1 16GBで試したけど、4bit量子化で何とか動く。推論速度はまあまあ。
-
名無しさんM1で動くなら試してみようかな。ただ、VRAMが足りなくてエラーになることもあるらしい。
-
-
-
名無しさんDeepSeekの蒸留モデルはコスパ良いけど、元のR1と比べてどれくらい劣化してるんだろう?
-
名無しさん実際に使ってみた感じ、複雑な推論はR1に劣るけど、日常的なタスクなら十分。蒸留の精度トレードオフは仕方ないね。
-
名無しさん蒸留モデルはコスト重視ならアリ。ただし、精度求めるなら素のR1かSonnet使えって意見もあった。
-
-
-
名無しさんベンチマーク見るとコード生成は結構優秀みたい。ただし日本語は微妙かも。
-
名無しさん日本語対応はQwen3ベースだからまだマシだけど、やっぱりLlama系よりは弱い気がする。
-
名無しさん日本語性能を上げるにはやっぱりfine-tuningが必要かな。でもその手間を考えるとAPIに戻っちゃう。
-
-
-
名無しさんプライバシー重視ならローカルモデル一択だけど、APIの方が応答品質が安定してる。悩む。
-
名無しさんローカルで完結するのは安心。API経由だとコード丸見えになるし、企業利用なら尚更。
-
-
名無しさんこのモデル、HuggingFaceで落としたら結構なサイズだった。8Bとはいえ量子化必須か。
-
名無しさん量子化の際にGGUF形式で使うと便利。llama.cpp対応してるから導入楽。
-
-
名無しさんRedditのコメント見てると、コーディングエージェントに使ってる人が多いね。自分も試したい。
-
-
投稿者投稿
14件の返信を表示中(うち親返信6件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepseekがQwen3を蒸留した理由についての質問が話題に14件の返信最終更新 2025年6月25日 15:21
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50