- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年前に更新されました。
25件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、DeepSeek v4 Flashの量子化モデルを探しているスレッドが立っていました。ユーザーは「動く量子化モデルを探している」と投稿し、コミュニティからはベンチマーク結果やプライバシー、コストに関する議論が交わされていました。ローカルLLMとしての活用や、他のモデルとの比較も話題に。
-
名無しさん自分もDeepSeek v4 Flashの量子化モデル探してるんだけど、なかなか見つからないよね。GGUF形式で公開されてるやつある?
-
名無しさん2だけど、HuggingFaceでいくつか見つけたよ。ただし古いバージョンのが多い。
-
-
名無しさん量子化ビット数はどのくらいがいいんだろう?4bitで十分かな
-
名無しさん4bitだと品質落ちるって話もある。8bitなら問題ないけどサイズが…
-
名無しさん個人的には4bitでも実用範囲だと思う。コード生成なら十分。
-
-
名無しさんそもそもDeepSeek v4 Flashって、v3と比べてどれくらい性能上がったの?
-
名無しさんベンチマーク見ると結構差があるよ。特に数学とコーディング。
-
-
名無しさんでもAPI使えばいいじゃん。ローカルで動かす必要ある?
-
名無しさんプライバシーの問題でローカルじゃないとダメな場合もあるからね。
-
名無しさんそうそう、機密データ扱うならローカル一択。
-
-
名無しさんコスト面ではAPIの方が安いこともあるけど、大量に使うならローカルの方が結果的に安いかも。
-
名無しさん実際に動かしてみた人いる?RAMどれくらい必要?
-
名無しさん自分は32GBのVRAMで4bit量子化モデル動かしてる。結構いけるよ。
-
名無しさんCPUで動かすのはきついよね。GPU必須。
-
-
名無しさんGGUFで量子化する簡単なスクリプト誰か持ってない?
-
名無しさんllama.cppのconvert.py使えばいけるんじゃない?
-
名無しさん変換に時間かかるのがネックだよな。
-
-
名無しさんそういえば、DeepSeekってMITライセンスだっけ?商用利用できる?
-
名無しさん確かMITだよ。商用利用OK。
-
名無しさんただ、Flash版はまだ実験的って話もあるから注意。
-
-
名無しさんとりあえずHuggingFaceで検索してみるわ。情報ありがとう。
-
名無しさん動いたらまた報告してほしいな。
-
-
名無しさん量子化モデルのリンク貼ってくれる人いない?
-
名無しさん自分も知りたい。特に4bit量子化で動くやつ。
-
-
名無しさん海外のフォーラムだと情報あるかもね。Reddit以外でも。
-
-
投稿者投稿
25件の返信を表示中(うち親返信11件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01