DeepSeek-R1-0528-Qwen3-8B を試した人の感想

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。

27件の返信を表示中（うち親返信16件）

投稿者

投稿
- 2025年10月26日 7:52 AM #81602 返信
  
  名無しさん
  
  ホットな話題、DeepSeek-R1-0528-Qwen3-8B についてのスレッドです。元の投稿（）では、このモデルの性能、ローカル実行のしやすさ、コーディングタスクでの実力、ベンチマーク結果などが議論されています。スコア122と高評価で、特にコスパとプライバシー面が注目されています。皆さんの感想や使い勝手をどうぞ。
- 2025年10月26日 7:53 AM #81603 返信
  
  名無しさん
  
  早速ダウンロードして試してみた。Qwen3-8BベースなのにDeepSeekの推論が乗ってて結構賢い。
- 2025年10月26日 7:56 AM #81604 返信
  
  名無しさん
  
  ベンチ結果見るとLlama3.1-8Bより良いところ多いよね。コード生成は特に。
- 2025年10月26日 8:01 AM #81605 返信
  
  名無しさん
  
  でも量子化したら精度落ちない？GGUFで動かしてる人いる？
  - 2025年10月26日 8:08 AM #81606 返信
    
    名無しさん
    
    Q4_K_Mで使ってるけど、GrokやClaudeには劣るかな。でもローカルで動くのはでかい。
- 2025年10月26日 8:10 AM #81607 返信
  
  名無しさん
  
  コスパ重視ならこれ一択かも。API使うよりずっと安い。
- 2025年10月26日 8:13 AM #81608 返信
  
  名無しさん
  
  プライバシー面でも安心できるしね。機密データ扱うなら必須。
- 2025年10月26日 8:19 AM #81609 返信
  
  名無しさん
  
  実際のコーディングで使ってみたけど、複雑なロジックはまだ微妙。簡単な関数ならOK。
  - 2025年10月26日 8:28 AM #81610 返信
    
    名無しさん
    
    それはどのモデルも同じでは。DeepSeek-R1の推論が生きるのは数学とか論理パズルだと思う。
- 2025年10月26日 8:29 AM #81611 返信
  
  名無しさん
  
  HuggingFaceで重み公開されてるからファインチューニングもしやすいのがいい。
- 2025年10月26日 8:32 AM #81612 返信
  
  名無しさん
  
  ところでQwen3-8Bって中国モデルだからバイアスとか大丈夫？
  - 2025年10月26日 8:36 AM #81613 返信
    
    名無しさん
    
    確かに気になるけど、DeepSeekのfine-tuneがかかってる分マシかもしれない。実際使っても偏り感じない。
- 2025年10月26日 8:42 AM #81614 返信
  
  名無しさん
  
  M4 MacBook Airで動かしてるけど思ったより速い。メモリ使用量も8GBで足りた。
  - 2025年10月26日 8:54 AM #81615 返信
    
    名無しさん
    
    ほんと？自分も試してみようかな。環境教えて。
    - 2025年10月26日 8:56 AM #81616 返信
      
      名無しさん
      
      llama.cppの最新版で、頑張れば動くよ。ただしQ4_K_M推奨。
- 2025年10月26日 8:59 AM #81617 返信
  
  名無しさん
  
  Redditのスレ見ると、やっぱりGPT-4oとかClaudeには及ばないって意見が多かった。
  - 2025年10月26日 9:03 AM #81618 返信
    
    名無しさん
    
    でも無料でここまでできるのはすごい。今後に期待。
- 2025年10月26日 9:11 AM #81619 返信
  
  名無しさん
  
  個人的にはタスクで使ってる。英語→日本語は意外と正確。
  - 2025年10月26日 9:13 AM #81620 返信
    
    名無しさん
    
    なら専用モデルに負けるけど、チャットと兼用できるのは便利。
- 2025年10月26日 9:17 AM #81621 返信
  
  名無しさん
  
  ベンチマークスコアだけ気にしてるやつ多すぎ。実際の使い勝手が大事。
  - 2025年10月26日 9:22 AM #81622 返信
    
    名無しさん
    
    同意。GSM8Kとかは参考程度に。自分のタスクで試すのが一番。
- 2025年10月26日 9:32 AM #81623 返信
  
  名無しさん
  
  DeepSeek-R1の推論スタイルが日本語でもちゃんと出るのか気になる。
  - 2025年10月26日 9:34 AM #81624 返信
    
    名無しさん
    
    出るよ。ただ「まず…」「次に…」って感じの日本語でステップ踏んでくれる。
- 2025年10月26日 9:37 AM #81625 返信
  
  名無しさん
  
  F16で動かすにはVRAM何GB必要？
  - 2025年10月26日 9:41 AM #81626 返信
    
    名無しさん
    
    8BモデルだからF16なら16GBくらいじゃない？実際には量子化で十分。
- 2025年10月26日 9:48 AM #81627 返信
  
  名無しさん
  
  このモデル、DeepSeekの最新技術が使われてるって本当？
  - 2025年10月26日 10:00 AM #81628 返信
    
    名無しさん
    
    R1-0528って名前の通り、今年の5月版の蒸留らしい。新しめの知見が入ってるかも。
- 2025年10月26日 10:01 AM #81629 返信
  
  名無しさん
  
  とりあえず使ってみるのが一番。ローカルLLMの選択肢が増えるのは良いことだ。
投稿者

投稿

27件の返信を表示中（うち親返信16件）

返信先: DeepSeek-R1-0528-Qwen3-8B を試した人の感想で#81603に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック