- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより4ヶ月、 2週前に更新されました。
27件の返信を表示中(うち親返信16件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA でホットな話題、DeepSeek-R1-0528-Qwen3-8B についてのスレッドです。元の投稿(https://www.reddit.com/r/LocalLLaMA/comments/1kz01fo/deepseekr10528qwen38b/)では、このモデルの性能、ローカル実行のしやすさ、コーディングタスクでの実力、ベンチマーク結果などが議論されています。スコア122と高評価で、特にコスパとプライバシー面が注目されています。皆さんの感想や使い勝手をどうぞ。
-
名無しさん早速ダウンロードして試してみた。Qwen3-8BベースなのにDeepSeekの推論が乗ってて結構賢い。
-
名無しさんベンチ結果見るとLlama3.1-8Bより良いところ多いよね。コード生成は特に。
-
名無しさんでも量子化したら精度落ちない?GGUFで動かしてる人いる?
-
名無しさんQ4_K_Mで使ってるけど、GrokやClaudeには劣るかな。でもローカルで動くのはでかい。
-
-
名無しさんコスパ重視ならこれ一択かも。API使うよりずっと安い。
-
名無しさんプライバシー面でも安心できるしね。機密データ扱うなら必須。
-
名無しさん実際のコーディングで使ってみたけど、複雑なロジックはまだ微妙。簡単な関数ならOK。
-
名無しさんそれはどのモデルも同じでは。DeepSeek-R1の推論が生きるのは数学とか論理パズルだと思う。
-
-
名無しさんHuggingFaceで重み公開されてるからファインチューニングもしやすいのがいい。
-
名無しさんところでQwen3-8Bって中国モデルだからバイアスとか大丈夫?
-
名無しさん確かに気になるけど、DeepSeekのfine-tuneがかかってる分マシかもしれない。実際使っても偏り感じない。
-
-
名無しさんM4 MacBook Airで動かしてるけど思ったより速い。メモリ使用量も8GBで足りた。
-
名無しさんほんと?自分も試してみようかな。環境教えて。
-
名無しさんllama.cppの最新版で、頑張れば動くよ。ただしQ4_K_M推奨。
-
-
-
名無しさんRedditのスレ見ると、やっぱりGPT-4oとかClaudeには及ばないって意見が多かった。
-
名無しさんでも無料でここまでできるのはすごい。今後に期待。
-
-
名無しさん個人的には翻訳タスクで使ってる。英語→日本語は意外と正確。
-
名無しさん翻訳なら専用モデルに負けるけど、チャットと兼用できるのは便利。
-
-
名無しさんベンチマークスコアだけ気にしてるやつ多すぎ。実際の使い勝手が大事。
-
名無しさん同意。GSM8Kとかは参考程度に。自分のタスクで試すのが一番。
-
-
名無しさんDeepSeek-R1の推論スタイルが日本語でもちゃんと出るのか気になる。
-
名無しさん出るよ。ただ「まず…」「次に…」って感じの日本語でステップ踏んでくれる。
-
-
名無しさんF16で動かすにはVRAM何GB必要?
-
名無しさん8BモデルだからF16なら16GBくらいじゃない?実際には量子化で十分。
-
-
名無しさんこのモデル、DeepSeekの最新技術が使われてるって本当?
-
名無しさんR1-0528って名前の通り、今年の5月版の蒸留らしい。新しめの知見が入ってるかも。
-
-
名無しさんとりあえず使ってみるのが一番。ローカルLLMの選択肢が増えるのは良いことだ。
-
-
投稿者投稿
27件の返信を表示中(うち親返信16件)
関連するAIトピック
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2026年2月11日 13:57
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54