DeepSeek-R1-0528-Qwen3-8B を試した人の感想

掲示板 フォーラム AI DeepSeek-R1-0528-Qwen3-8B を試した人の感想

  • このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより4ヶ月、 2週前に更新されました。
27件の返信を表示中(うち親返信16件)
  • 投稿者
    投稿
    • #81602 返信
      名無しさん
      ホットな話題、DeepSeek-R1-0528-Qwen3-8B についてのスレッドです。元の投稿()では、このモデルの性能、ローカル実行のしやすさ、コーディングタスクでの実力、ベンチマーク結果などが議論されています。スコア122と高評価で、特にコスパとプライバシー面が注目されています。皆さんの感想や使い勝手をどうぞ。

    • #81603 返信
      名無しさん
      早速ダウンロードして試してみた。Qwen3-8BベースなのにDeepSeekの推論が乗ってて結構賢い。

    • #81604 返信
      名無しさん
      ベンチ結果見るとLlama3.1-8Bより良いところ多いよね。コード生成は特に。

    • #81605 返信
      名無しさん
      でも量子化したら精度落ちない?GGUFで動かしてる人いる?

      • #81606 返信
        名無しさん
        Q4_K_Mで使ってるけど、GrokやClaudeには劣るかな。でもローカルで動くのはでかい。

    • #81607 返信
      名無しさん
      コスパ重視ならこれ一択かも。API使うよりずっと安い。

    • #81608 返信
      名無しさん
      プライバシー面でも安心できるしね。機密データ扱うなら必須。

    • #81609 返信
      名無しさん
      実際のコーディングで使ってみたけど、複雑なロジックはまだ微妙。簡単な関数ならOK。

      • #81610 返信
        名無しさん
        それはどのモデルも同じでは。DeepSeek-R1の推論が生きるのは数学とか論理パズルだと思う。

    • #81611 返信
      名無しさん
      HuggingFaceで重み公開されてるからファインチューニングもしやすいのがいい。

    • #81612 返信
      名無しさん
      ところでQwen3-8Bって中国モデルだからバイアスとか大丈夫?

      • #81613 返信
        名無しさん
        確かに気になるけど、DeepSeekのfine-tuneがかかってる分マシかもしれない。実際使っても偏り感じない。

    • #81614 返信
      名無しさん
      M4 MacBook Airで動かしてるけど思ったより速い。メモリ使用量も8GBで足りた。

      • #81615 返信
        名無しさん
        ほんと?自分も試してみようかな。環境教えて。

        • #81616 返信
          名無しさん
          llama.cppの最新版で、頑張れば動くよ。ただしQ4_K_M推奨。

    • #81617 返信
      名無しさん
      Redditのスレ見ると、やっぱりGPT-4oとかClaudeには及ばないって意見が多かった。

      • #81618 返信
        名無しさん
        でも無料でここまでできるのはすごい。今後に期待。

    • #81619 返信
      名無しさん
      個人的にはタスクで使ってる。英語→日本語は意外と正確。

      • #81620 返信
        名無しさん
        なら専用モデルに負けるけど、チャットと兼用できるのは便利。

    • #81621 返信
      名無しさん
      ベンチマークスコアだけ気にしてるやつ多すぎ。実際の使い勝手が大事。

      • #81622 返信
        名無しさん
        同意。GSM8Kとかは参考程度に。自分のタスクで試すのが一番。

    • #81623 返信
      名無しさん
      DeepSeek-R1の推論スタイルが日本語でもちゃんと出るのか気になる。

      • #81624 返信
        名無しさん
        出るよ。ただ「まず…」「次に…」って感じの日本語でステップ踏んでくれる。

    • #81625 返信
      名無しさん
      F16で動かすにはVRAM何GB必要?

      • #81626 返信
        名無しさん
        8BモデルだからF16なら16GBくらいじゃない?実際には量子化で十分。

    • #81627 返信
      名無しさん
      このモデル、DeepSeekの最新技術が使われてるって本当?

      • #81628 返信
        名無しさん
        R1-0528って名前の通り、今年の5月版の蒸留らしい。新しめの知見が入ってるかも。

    • #81629 返信
      名無しさん
      とりあえず使ってみるのが一番。ローカルLLMの選択肢が増えるのは良いことだ。

27件の返信を表示中(うち親返信16件)
返信先: DeepSeek-R1-0528-Qwen3-8B を試した人の感想で#81619に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました