DeepSeek-R1-0528-Qwen3-8Bをローカルで試した人の分析まとめ

このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより1年前に更新されました。

14件の返信を表示中（うち親返信5件）

投稿者

投稿
- 2025年6月2日 2:50 PM #78075 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで「unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUFをローカルで使った分析」というスレッドが立っていました。
  DeepSeekモデルをQwen3ベースで8Bに蒸留したものらしく、ローカルLLMとしての性能・コスパ・プライバシー・コーディング能力などが議論されています。全体的に「結構使える」「ただし量子化の影響が大きい」「R1と比べると少し劣るが軽量」といった意見が多かったです。皆さんどう思いますか？
- 2025年6月2日 2:52 PM #78076 返信
  
  名無しさん
  
  とりあえずGGUFで落として試してみた。8BなのでVRAM 8GBでもギリ動く。速度はまあまあ。
  - 2025年6月2日 2:55 PM #78077 返信
    
    名無しさん
    
    どの量子化使った？Q4_K_Mだとちょっと質感落ちる気がする。
    - 2025年6月2日 2:59 PM #78078 返信
      
      名無しさん
      
      Q4_K_Mだけど普通に使えるよ。コード生成は悪くない。
- 2025年6月2日 3:06 PM #78079 返信
  
  名無しさん
  
  R1の蒸留版だからか、思考プロセスが短めで助かる。でも複雑な推論だとやっぱり限界を感じる。
  - 2025年6月2日 3:08 PM #78080 返信
    
    名無しさん
    
    それな。簡単な質問なら即答してくれるけど、ちょっとひねるとDeepSeek-R1フルサイズとの差が顕著に出る。
    - 2025年6月2日 3:12 PM #78081 返信
      
      名無しさん
      
      でもフルサイズは重いし、個人で運用するならこのサイズで十分じゃない？
      - 2025年6月2日 3:18 PM #78082 返信
        
        名無しさん
        
        個人用途なら8Bでコスパ良いよね。電気代も気にしなくていいし。
- 2025年6月2日 3:27 PM #78083 返信
  
  名無しさん
  
  Unslothの最適化が効いてるのか、llama.cppより読み込み速い気がする。
  - 2025年6月2日 3:28 PM #78084 返信
    
    名無しさん
    
    それはたぶん量子化フォーマットの違いだよ。Unsloth専用にチューニングされてる可能性もある。
- 2025年6月2日 3:31 PM #78085 返信
  
  名無しさん
  
  Redditでは結構好評だったけど、日本語性能はどうなんだろ？
  - 2025年6月2日 3:35 PM #78086 返信
    
    名無しさん
    
    そこが気になる。Qwenベースだから中国語は強いけど日本語は未知数。
    - 2025年6月2日 3:41 PM #78087 返信
      
      名無しさん
      
      試しに日本語で質問してみたけど、普通に答えてくれた。ただやっぱり英語の方が精度高い感じ。
- 2025年6月2日 3:53 PM #78088 返信
  
  名無しさん
  
  正直、商用モデルに勝てるレベルではないけど、プライバシー重視なら選択肢に入る。
  - 2025年6月2日 3:55 PM #78089 返信
    
    名無しさん
    
    同意。ローカルで動く安心感と、それなりの性能のバランスが取れてる。今後に期待。
投稿者

投稿

14件の返信を表示中（うち親返信5件）

返信先: DeepSeek-R1-0528-Qwen3-8Bをローカルで試した人の分析まとめ

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック