- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
19件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「No GGUFs for DeepSeek V4-Flash as yet?」というスレッドが立っていました。DeepSeek V4-Flashは高性能で注目されてるけど、まだGGUF形式のモデルが公開されていないという話題です。コード生成能力やコスパ、プライバシー面での評価、他のモデルとの比較など、いろいろ意見が出ていました。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1swniff/no_ggufs_for_deepseek_v4flash_as_yet/
-
名無しさんGGUF待ってるんだが、まだかよ。
-
名無しさん公式が配布してないからじゃない?サードパーティが変換するの待つしかないね。
-
名無しさんでもV4-FlashってAPI専用設計じゃなかった?ローカルで動かす想定じゃないかも。
-
名無しさんいや、重みは公開されてるらしいよ。ただGGUF化が面倒なだけかと。
-
-
-
名無しさんコード生成の性能がすごいって聞いたけど、本当?
-
名無しさん自分で試したけど、確かにClaudeやGPT-4に匹敵するレベル。でも量子化すると劣化するかも。
-
名無しさんGGUFがなくてもAPI叩けばいいじゃん。コスパも良いし。
-
名無しさんプライバシー的にローカルで動かしたいんだよ。APIはリスクある。
-
-
-
-
名無しさんHuggingFaceでモデルファイル探してみたけど、GGUFはないね。Safetensorsはある。
-
名無しさん自分で変換するしかないか。llama.cppのconvert.pyでいける?
-
名無しさん試したけどアーキテクチャが特殊で失敗したって人いたよ。
-
名無しさんじゃあしばらく待ったほうがいいな。有志がなんとかするでしょ。
-
-
-
-
名無しさんDeepSeekって中国の企業だよね。データ収集が心配。
-
名無しさんローカルで使うなら問題ない。API経由だと監視されるかもだが。
-
名無しさんV4-Flashのベンチマーク見ると、コーディング特化でかなり優秀。他の汎用モデルより良い。
-
名無しさんでもV4シリーズはパラメータ数が多いから、ローカルで動かすにはハードル高い。
-
名無しさん量子化すれば何とかなる。GGUFの4bitなら8GB VRAMでも動くって話。
-
-
-
-
-
名無しさんとりあえずGGUFが出たら教えてくれ。便利なスレッドだな。
-
名無しさん同じく。情報求む。
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信6件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepseekがQwen3を蒸留した理由についての質問が話題に14件の返信最終更新 2026年2月10日 18:42
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44