Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい

名無しさん · 2025-06-25T18:36:40+09:00

Redditのr/LocalLLaMAで話題になっているスレッド「Deepseek-r1-0528-qwen3-8b is much better than expected.」を紹介します。（: ）このモデルは8Bパラメータながら、コーディングや推論で予想以上の性能を発揮しているとのこと。ローカルLLMユーザーの間では、コストパフォーマンスやプライバシーの面でも注目されています。皆さんの感想や使用体験を聞かせてください。

このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年前に更新されました。

25件の返信を表示中（うち親返信13件）

投稿者

投稿
- 2025年6月25日 6:36 PM #81630 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで話題になっているスレッド「Deepseek-r1-0528-qwen3-8b is much better than expected.」を紹介します。（: ）このモデルは8Bパラメータながら、コーディングや推論で予想以上の性能を発揮しているとのこと。ローカルLLMユーザーの間では、コストパフォーマンスやプライバシーの面でも注目されています。皆さんの感想や使用体験を聞かせてください。
- 2025年6月25日 6:38 PM #81631 返信
  
  名無しさん
  
  確かに8Bでこれだけの性能は驚きだね。Qwenベースってのもポイント高い。
  - 2025年6月25日 6:45 PM #81633 返信
    
    名無しさん
    
    でも実際に使うと過学習感があるって話も聞くよ。
- 2025年6月25日 6:41 PM #81632 返信
  
  名無しさん
  
  まだ試してないけど、ベンチマークスコア見ると結構良いみたい。
- 2025年6月25日 6:52 PM #81634 返信
  
  名無しさん
  
  ローカルで動かすにはちょうどいいサイズだね。VRAM8GBでもいける？
  - 2025年6月25日 6:54 PM #81635 返信
    
    名無しさん
    
    4ビット量子化ならいけるんじゃないかな。試した人いる？
- 2025年6月25日 6:58 PM #81636 返信
  
  名無しさん
  
  DeepSeekって中国のモデルだから、ライセンスとかデータの扱いが気になる。
  - 2025年6月25日 7:04 PM #81637 返信
    
    名無しさん
    
    それはそうだけど、ローカルで動かすならプライバシーは大丈夫でしょ。
- 2025年6月25日 7:13 PM #81638 返信
  
  名無しさん
  
  自分はコーディングで試したけど、コード補完はまあまあ。GPT-4には及ばない。
  - 2025年6月25日 7:14 PM #81639 返信
    
    名無しさん
    
    でも8Bでこれなら優秀だと思うよ。用途次第。
- 2025年6月25日 7:17 PM #81640 返信
  
  名無しさん
  
  他のモデルと比較すると、Llama-3-8Bよりは確かにいい感じ。
  - 2025年6月25日 7:21 PM #81641 返信
    
    名無しさん
    
    ベンチマークだけじゃなく実際の会話も試してみたい。
- 2025年6月25日 7:27 PM #81642 返信
  
  名無しさん
  
  正直なところ、期待ほどじゃなかった。プロンプトによっては変な回答返す。
  - 2025年6月25日 7:39 PM #81643 返信
    
    名無しさん
    
    具体的にどんな感じ？日本語はちゃんと通じる？
    - 2025年6月25日 7:40 PM #81644 返信
      
      名無しさん
      
      日本語はまあまあ。たまに中国語混ざるけど。
- 2025年6月25日 7:43 PM #81645 返信
  
  名無しさん
  
  DeepSeek系のモデルは結構アップデート激しいから、このバージョンだけの評価は難しい。
- 2025年6月25日 7:48 PM #81646 返信
  
  名無しさん
  
  8Bってちょうどいいから、すぐに試せるのがいいね。
  - 2025年6月25日 7:56 PM #81647 返信
    
    名無しさん
    
    ダウンロードリンク教えて。
- 2025年6月25日 7:58 PM #81648 返信
  
  名無しさん
  
  Redditのスレ読んだけど、コメントでも結構好意的だったよ。
  - 2025年6月25日 8:02 PM #81649 返信
    
    名無しさん
    
    でも最近のRedditは質が落ちた気がする。
- 2025年6月25日 8:07 PM #81650 返信
  
  名無しさん
  
  個人的にはMistral系のほうが好みかな。
  - 2025年6月25日 8:17 PM #81651 返信
    
    名無しさん
    
    Mistralの新しい7Bも気になるけど、DeepSeekの方がパラメータ効率いいって話もある。
- 2025年6月25日 8:19 PM #81652 返信
  
  名無しさん
  
  このスレで言及されてる「予想以上」ってのがどの程度なのか、実際に使ってみないとわからないね。
  - 2025年6月25日 8:21 PM #81653 返信
    
    名無しさん
    
    自分は試したけど、コード生成で微妙だったから、期待しすぎないほうがいい。
- 2025年6月25日 8:26 PM #81654 返信
  
  名無しさん
  
  とりあえずダウンロードして動かしてみる価値はあると思う。
  - 2025年6月25日 8:32 PM #81655 返信
    
    名無しさん
    
    同意。とりあえず試して、自分で判断するのが一番。
投稿者

投稿

25件の返信を表示中（うち親返信13件）

返信先: Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック