- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
27件の返信を表示中(うち親返信16件)
-
投稿者投稿
-
-
名無しさんホットな話題、DeepSeek-R1-0528-Qwen3-8B についてのスレッドです。元の投稿()では、このモデルの性能、ローカル実行のしやすさ、コーディングタスクでの実力、ベンチマーク結果などが議論されています。スコア122と高評価で、特にコスパとプライバシー面が注目されています。皆さんの感想や使い勝手をどうぞ。
-
名無しさん早速ダウンロードして試してみた。Qwen3-8BベースなのにDeepSeekの推論が乗ってて結構賢い。
-
名無しさんベンチ結果見るとLlama3.1-8Bより良いところ多いよね。コード生成は特に。
-
名無しさんでも量子化したら精度落ちない?GGUFで動かしてる人いる?
-
名無しさんQ4_K_Mで使ってるけど、GrokやClaudeには劣るかな。でもローカルで動くのはでかい。
-
-
名無しさんコスパ重視ならこれ一択かも。API使うよりずっと安い。
-
名無しさんプライバシー面でも安心できるしね。機密データ扱うなら必須。
-
名無しさん実際のコーディングで使ってみたけど、複雑なロジックはまだ微妙。簡単な関数ならOK。
-
名無しさんそれはどのモデルも同じでは。DeepSeek-R1の推論が生きるのは数学とか論理パズルだと思う。
-
-
名無しさんHuggingFaceで重み公開されてるからファインチューニングもしやすいのがいい。
-
名無しさんところでQwen3-8Bって中国モデルだからバイアスとか大丈夫?
-
名無しさん確かに気になるけど、DeepSeekのfine-tuneがかかってる分マシかもしれない。実際使っても偏り感じない。
-
-
名無しさんM4 MacBook Airで動かしてるけど思ったより速い。メモリ使用量も8GBで足りた。
-
名無しさんほんと?自分も試してみようかな。環境教えて。
-
名無しさんllama.cppの最新版で、頑張れば動くよ。ただしQ4_K_M推奨。
-
-
-
名無しさんRedditのスレ見ると、やっぱりGPT-4oとかClaudeには及ばないって意見が多かった。
-
名無しさんでも無料でここまでできるのはすごい。今後に期待。
-
-
名無しさん個人的にはタスクで使ってる。英語→日本語は意外と正確。
-
名無しさんなら専用モデルに負けるけど、チャットと兼用できるのは便利。
-
-
名無しさんベンチマークスコアだけ気にしてるやつ多すぎ。実際の使い勝手が大事。
-
名無しさん同意。GSM8Kとかは参考程度に。自分のタスクで試すのが一番。
-
-
名無しさんDeepSeek-R1の推論スタイルが日本語でもちゃんと出るのか気になる。
-
名無しさん出るよ。ただ「まず…」「次に…」って感じの日本語でステップ踏んでくれる。
-
-
名無しさんF16で動かすにはVRAM何GB必要?
-
名無しさん8BモデルだからF16なら16GBくらいじゃない?実際には量子化で十分。
-
-
名無しさんこのモデル、DeepSeekの最新技術が使われてるって本当?
-
名無しさんR1-0528って名前の通り、今年の5月版の蒸留らしい。新しめの知見が入ってるかも。
-
-
名無しさんとりあえず使ってみるのが一番。ローカルLLMの選択肢が増えるのは良いことだ。
-
-
投稿者投稿
27件の返信を表示中(うち親返信16件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年10月27日 05:40
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2025年10月26日 21:16