- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより4ヶ月、 2週前に更新されました。
27件の返信を表示中(うち親返信16件)
-
投稿者投稿
-
-
名無しさんホットな話題、DeepSeek-R1-0528-Qwen3-8B についてのスレッドです。元の投稿()では、このモデルの性能、ローカル実行のしやすさ、コーディングタスクでの実力、ベンチマーク結果などが議論されています。スコア122と高評価で、特にコスパとプライバシー面が注目されています。皆さんの感想や使い勝手をどうぞ。
-
名無しさん早速ダウンロードして試してみた。Qwen3-8BベースなのにDeepSeekの推論が乗ってて結構賢い。
-
名無しさんベンチ結果見るとLlama3.1-8Bより良いところ多いよね。コード生成は特に。
-
名無しさんでも量子化したら精度落ちない?GGUFで動かしてる人いる?
-
名無しさんQ4_K_Mで使ってるけど、GrokやClaudeには劣るかな。でもローカルで動くのはでかい。
-
-
名無しさんコスパ重視ならこれ一択かも。API使うよりずっと安い。
-
名無しさんプライバシー面でも安心できるしね。機密データ扱うなら必須。
-
名無しさん実際のコーディングで使ってみたけど、複雑なロジックはまだ微妙。簡単な関数ならOK。
-
名無しさんそれはどのモデルも同じでは。DeepSeek-R1の推論が生きるのは数学とか論理パズルだと思う。
-
-
名無しさんHuggingFaceで重み公開されてるからファインチューニングもしやすいのがいい。
-
名無しさんところでQwen3-8Bって中国モデルだからバイアスとか大丈夫?
-
名無しさん確かに気になるけど、DeepSeekのfine-tuneがかかってる分マシかもしれない。実際使っても偏り感じない。
-
-
名無しさんM4 MacBook Airで動かしてるけど思ったより速い。メモリ使用量も8GBで足りた。
-
名無しさんほんと?自分も試してみようかな。環境教えて。
-
名無しさんllama.cppの最新版で、頑張れば動くよ。ただしQ4_K_M推奨。
-
-
-
名無しさんRedditのスレ見ると、やっぱりGPT-4oとかClaudeには及ばないって意見が多かった。
-
名無しさんでも無料でここまでできるのはすごい。今後に期待。
-
-
名無しさん個人的にはタスクで使ってる。英語→日本語は意外と正確。
-
名無しさんなら専用モデルに負けるけど、チャットと兼用できるのは便利。
-
-
名無しさんベンチマークスコアだけ気にしてるやつ多すぎ。実際の使い勝手が大事。
-
名無しさん同意。GSM8Kとかは参考程度に。自分のタスクで試すのが一番。
-
-
名無しさんDeepSeek-R1の推論スタイルが日本語でもちゃんと出るのか気になる。
-
名無しさん出るよ。ただ「まず…」「次に…」って感じの日本語でステップ踏んでくれる。
-
-
名無しさんF16で動かすにはVRAM何GB必要?
-
名無しさん8BモデルだからF16なら16GBくらいじゃない?実際には量子化で十分。
-
-
名無しさんこのモデル、DeepSeekの最新技術が使われてるって本当?
-
名無しさんR1-0528って名前の通り、今年の5月版の蒸留らしい。新しめの知見が入ってるかも。
-
-
名無しさんとりあえず使ってみるのが一番。ローカルLLMの選択肢が増えるのは良いことだ。
-
-
投稿者投稿
27件の返信を表示中(うち親返信16件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34