- このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより8ヶ月、 4週前に更新されました。
15件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA より、GLM-4.5-Air(6ビット量子化)と DeepSeek V4 Flash 284B(2ビット量子化)を128GBメモリのMacで動かして比較したスレッド。結果はDeepSeekの2bitモデルが性能・速度ともに優勢だったとのこと。量子化のトレードオフやローカルLLMの実用性について議論になっています。元スレ: https://www.reddit.com/r/LocalLLaMA/comments/1uc67xu/glm45air_6bit_vs_deepseek_v4_flash_284b_2bit/
-
名無しさん2bitで284Bって凄いな。でも品質は大丈夫なのか?
-
名無しさん実際に使ってみた人の話だと、コード生成とかなら十分実用的らしい。ただし日本語は微妙かも。
-
-
名無しさん128GB Macでも動くのか…メモリ食いすぎでしょ。うちの64GBじゃ無理だな。
-
名無しさん32GBでもなんとか動くモデルあるけど、速度は犠牲になるね。
-
-
名無しさんGLM-4.5-Airって聞いたことないけど、中国のモデル?
-
名無しさんそう、Zhipu AIのモデル。6bitでもメモリは食うけど、DeepSeekの方がコスパ良さそう。
-
-
名無しさん2bitって極端だけど、ベンチマークではどうなんだろう。自分はllama.cppで4bit使ってる。
-
名無しさんスレ主のテストではDeepSeekの方が性能良かったらしい。でも2bitはさすがに情報落ちが心配。
-
-
名無しさんこんな大規模モデルをローカルで動かす意味ある?API使った方が安くない?
-
名無しさんプライバシー重視ならローカル一択。それに一度動かせばタダだし。
-
名無しさん電気代考えたら?まあ趣味の世界だよね。
-
-
-
名無しさんMacで動かすメリットってあるの?CUDA使えないし。
-
名無しさんMetal対応でそこそこ速いよ。それにメモリ統一だから大容量モデル向き。
-
-
名無しさんDeepSeek V4 Flashってチャット向け?コード向け?使い分けが知りたい。
-
名無しさん両方いけるみたい。ただ指示によっては変な応答もあるってレビューあった。
-
-
-
投稿者投稿
15件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44