DeepSeek-R1-0528のGGUF版が話題に

掲示板 フォーラム AI DeepSeek-R1-0528のGGUF版が話題に

  • このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
15件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #81188 返信
      名無しさん
      「ubergarm/DeepSeek-R1-0528-GGUF」という投稿があり、DeepSeek-R1-0528のGGUF量子化モデルが公開されたようです。
      ローカルLLMユーザーにとっては、コード生成や推論タスクでの性能、VRAM使用量、コスト面など気になる話題ですね。ベンチマークスコアや他のモデルとの比較、プライバシーの観点からも議論が期待されます。皆さんの意見を聞かせてください。

    • #81189 返信
      名無しさん
      ついに来たか。Q4_K_Mくらいで試してみたい。

    • #81190 返信
      名無しさん
      これってコーディング特化のやつ?普通のチャットにも使える?

      • #81191 返信
        名無しさん
        DeepSeekシリーズは汎用だけどコーディングが強いらしい。試してみないと分からん。

    • #81192 返信
      名無しさん
      VRAM消費量はどれくらい?48GBで動く?

      • #81193 返信
        名無しさん
        Q4_K_Mなら24GBでもいけるかも。ただしコンテキスト次第。

    • #81194 返信
      名無しさん
      ベンチマーク見るとMistral Largeより良いんだっけ?

    • #81195 返信
      名無しさん
      GGUF化してくれてありがたい。自分で量子化する手間が省ける。

      • #81196 返信
        名無しさん
        でも公式の量子化じゃないから品質にばらつきがあるかも。

    • #81197 返信
      名無しさん
      これってAPI経由より遅い?ローカルで動かす意味ある?

      • #81198 返信
        名無しさん
        プライバシー重視ならローカル一択。速度より安心感。

    • #81199 返信
      名無しさん
      OSSモデルが増えて嬉しい。でもDeepSeekのライセンス大丈夫?

      • #81200 返信
        名無しさん
        確か商用利用OKだったはず。ただ規約は各自確認を。

    • #81201 返信
      名無しさん
      llama.cppで動くよね?まだ試してないけど。

      • #81202 返信
        名無しさん
        主なGGUFは全部llama.cpp対応だから大丈夫。

    • #81203 返信
      名無しさん
      どの量子化サイズがコスパいいんだろう。ベンチ待ち。

15件の返信を表示中(うち親返信9件)
返信先: DeepSeek-R1-0528のGGUF版が話題にで#81197に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました