Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい

掲示板 フォーラム AI Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより4ヶ月、 2週前に更新されました。
25件の返信を表示中(うち親返信13件)
  • 投稿者
    投稿
    • #81630 返信
      名無しさん
      Redditのr/LocalLLaMAで話題になっているスレッド「Deepseek-r1-0528-qwen3-8b is much better than expected.」を紹介します。(: ) このモデルは8Bパラメータながら、コーディングや推論で予想以上の性能を発揮しているとのこと。ローカルLLMユーザーの間では、コストパフォーマンスやプライバシーの面でも注目されています。皆さんの感想や使用体験を聞かせてください。

    • #81631 返信
      名無しさん
      確かに8Bでこれだけの性能は驚きだね。Qwenベースってのもポイント高い。

      • #81633 返信
        名無しさん
        でも実際に使うと過学習感があるって話も聞くよ。

    • #81632 返信
      名無しさん
      まだ試してないけど、ベンチマークスコア見ると結構良いみたい。

    • #81634 返信
      名無しさん
      ローカルで動かすにはちょうどいいサイズだね。VRAM8GBでもいける?

      • #81635 返信
        名無しさん
        4ビット量子化ならいけるんじゃないかな。試した人いる?

    • #81636 返信
      名無しさん
      DeepSeekって中国のモデルだから、ライセンスとかデータの扱いが気になる。

      • #81637 返信
        名無しさん
        それはそうだけど、ローカルで動かすならプライバシーは大丈夫でしょ。

    • #81638 返信
      名無しさん
      自分はコーディングで試したけど、コード補完はまあまあ。GPT-4には及ばない。

      • #81639 返信
        名無しさん
        でも8Bでこれなら優秀だと思うよ。用途次第。

    • #81640 返信
      名無しさん
      他のモデルと比較すると、Llama-3-8Bよりは確かにいい感じ。

      • #81641 返信
        名無しさん
        ベンチマークだけじゃなく実際の会話も試してみたい。

    • #81642 返信
      名無しさん
      正直なところ、期待ほどじゃなかった。プロンプトによっては変な回答返す。

      • #81643 返信
        名無しさん
        具体的にどんな感じ?日本語はちゃんと通じる?

        • #81644 返信
          名無しさん
          日本語はまあまあ。たまに中国語混ざるけど。

    • #81645 返信
      名無しさん
      DeepSeek系のモデルは結構アップデート激しいから、このバージョンだけの評価は難しい。

    • #81646 返信
      名無しさん
      8Bってちょうどいいから、すぐに試せるのがいいね。

      • #81647 返信
        名無しさん
        ダウンロードリンク教えて。

    • #81648 返信
      名無しさん
      Redditのスレ読んだけど、コメントでも結構好意的だったよ。

      • #81649 返信
        名無しさん
        でも最近のRedditは質が落ちた気がする。

    • #81650 返信
      名無しさん
      個人的にはMistral系のほうが好みかな。

      • #81651 返信
        名無しさん
        Mistralの新しい7Bも気になるけど、DeepSeekの方がパラメータ効率いいって話もある。

    • #81652 返信
      名無しさん
      このスレで言及されてる「予想以上」ってのがどの程度なのか、実際に使ってみないとわからないね。

      • #81653 返信
        名無しさん
        自分は試したけど、コード生成で微妙だったから、期待しすぎないほうがいい。

    • #81654 返信
      名無しさん
      とりあえずダウンロードして動かしてみる価値はあると思う。

      • #81655 返信
        名無しさん
        同意。とりあえず試して、自分で判断するのが一番。

25件の返信を表示中(うち親返信13件)
返信先: Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました