GLM-4.5-Air 6bit vs DeepSeek V4 Flash 284B 2bit、128GB Macで比較したら2bitの方が勝ったらしい

掲示板 フォーラム AI GLM-4.5-Air 6bit vs DeepSeek V4 Flash 284B 2bit、128GB Macで比較したら2bitの方が勝ったらしい

  • このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
15件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #61180 返信
      名無しさん
      、GLM-4.5-Air(6ビット量子化)と DeepSeek V4 Flash 284B(2ビット量子化)を128GBメモリのMacで動かして比較したスレッド。結果はDeepSeekの2bitモデルが性能・速度ともに優勢だったとのこと。量子化のトレードオフやローカルLLMの実用性について議論になっています。

    • #61181 返信
      名無しさん
      2bitで284Bって凄いな。でも品質は大丈夫なのか?

      • #61182 返信
        名無しさん
        実際に使ってみた人の話だと、コード生成とかなら十分実用的らしい。ただし日本語は微妙かも。

    • #61183 返信
      名無しさん
      128GB Macでも動くのか…メモリ食いすぎでしょ。うちの64GBじゃ無理だな。

      • #61184 返信
        名無しさん
        32GBでもなんとか動くモデルあるけど、速度は犠牲になるね。

    • #61185 返信
      名無しさん
      GLM-4.5-Airって聞いたことないけど、中国のモデル?

      • #61186 返信
        名無しさん
        そう、Zhipu AIのモデル。6bitでもメモリは食うけど、DeepSeekの方がコスパ良さそう。

    • #61187 返信
      名無しさん
      2bitって極端だけど、ベンチマークではどうなんだろう。自分はllama.cppで4bit使ってる。

      • #61188 返信
        名無しさん
        スレ主のテストではDeepSeekの方が性能良かったらしい。でも2bitはさすがに情報落ちが心配。

    • #61189 返信
      名無しさん
      こんな大規模モデルをローカルで動かす意味ある?API使った方が安くない?

      • #61190 返信
        名無しさん
        プライバシー重視ならローカル一択。それに一度動かせばタダだし。

        • #61191 返信
          名無しさん
          電気代考えたら?まあ趣味の世界だよね。

    • #61192 返信
      名無しさん
      Macで動かすメリットってあるの?CUDA使えないし。

      • #61193 返信
        名無しさん
        Metal対応でそこそこ速いよ。それにメモリ統一だから大容量モデル向き。

    • #61194 返信
      名無しさん
      DeepSeek V4 Flashってチャット向け?コード向け?使い分けが知りたい。

      • #61195 返信
        名無しさん
        両方いけるみたい。ただ指示によっては変な応答もあるってレビューあった。

15件の返信を表示中(うち親返信7件)
返信先: GLM-4.5-Air 6bit vs DeepSeek V4 Flash 284B 2bit、128GB Macで比較したら2bitの方が勝ったらしいで#61188に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました