DeepSeek V4-FlashのGGUFまだ出ないの?

掲示板 フォーラム AI DeepSeek V4-FlashのGGUFまだ出ないの?

  • このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
19件の返信を表示中(うち親返信6件)
  • 投稿者
    投稿
    • #63609 返信
      名無しさん
      Redditのr/LocalLLaMAで「No GGUFs for DeepSeek V4-Flash as yet?」というスレッドが立っていました。DeepSeek V4-Flashは高性能で注目されてるけど、まだGGUF形式のモデルが公開されていないという話題です。コード生成能力やコスパ、プライバシー面での評価、他のモデルとの比較など、いろいろ意見が出ていました。

    • #63610 返信
      名無しさん
      GGUF待ってるんだが、まだかよ。

    • #63611 返信
      名無しさん
      公式が配布してないからじゃない?サードパーティが変換するの待つしかないね。

      • #63612 返信
        名無しさん
        でもV4-FlashってAPI専用設計じゃなかった?ローカルで動かす想定じゃないかも。

        • #63613 返信
          名無しさん
          いや、重みは公開されてるらしいよ。ただGGUF化が面倒なだけかと。

    • #63614 返信
      名無しさん
      コード生成の性能がすごいって聞いたけど、本当?

      • #63615 返信
        名無しさん
        自分で試したけど、確かにClaudeやGPT-4に匹敵するレベル。でも量子化すると劣化するかも。

        • #63616 返信
          名無しさん
          GGUFがなくてもAPI叩けばいいじゃん。コスパも良いし。

          • #63617 返信
            名無しさん
            プライバシー的にローカルで動かしたいんだよ。APIはリスクある。

    • #63618 返信
      名無しさん
      HuggingFaceでモデルファイル探してみたけど、GGUFはないね。Safetensorsはある。

      • #63619 返信
        名無しさん
        自分で変換するしかないか。llama.cppのconvert.pyでいける?

        • #63620 返信
          名無しさん
          試したけどアーキテクチャが特殊で失敗したって人いたよ。

          • #63621 返信
            名無しさん
            じゃあしばらく待ったほうがいいな。有志がなんとかするでしょ。

    • #63622 返信
      名無しさん
      DeepSeekって中国の企業だよね。データ収集が心配。

      • #63623 返信
        名無しさん
        ローカルで使うなら問題ない。API経由だと監視されるかもだが。

        • #63624 返信
          名無しさん
          V4-Flashのベンチマーク見ると、コーディング特化でかなり優秀。他の汎用モデルより良い。

          • #63625 返信
            名無しさん
            でもV4シリーズはパラメータ数が多いから、ローカルで動かすにはハードル高い。

            • #63626 返信
              名無しさん
              量子化すれば何とかなる。GGUFの4bitなら8GB VRAMでも動くって話。

    • #63627 返信
      名無しさん
      とりあえずGGUFが出たら教えてくれ。便利なスレッドだな。

      • #63628 返信
        名無しさん
        同じく。情報求む。

19件の返信を表示中(うち親返信6件)
返信先: DeepSeek V4-FlashのGGUFまだ出ないの?で#63616に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました