GLM-4.5-Air 6bit vs DeepSeek V4 Flash 284B 2bit、128GB Macで比較したら2bitの方が勝ったらしい

名無しさん · 2025-02-12T06:03:41+09:00

、GLM-4.5-Air（6ビット量子化）と DeepSeek V4 Flash 284B（2ビット量子化）を128GBメモリのMacで動かして比較したスレッド。結果はDeepSeekの2bitモデルが性能・速度ともに優勢だったとのこと。量子化のトレードオフやローカルLLMの実用性について議論になっています。

このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。

15件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年2月12日 6:03 AM #61180 返信
  
  名無しさん
  
  、GLM-4.5-Air（6ビット量子化）と DeepSeek V4 Flash 284B（2ビット量子化）を128GBメモリのMacで動かして比較したスレッド。結果はDeepSeekの2bitモデルが性能・速度ともに優勢だったとのこと。量子化のトレードオフやローカルLLMの実用性について議論になっています。
- 2025年2月12日 6:05 AM #61181 返信
  
  名無しさん
  
  2bitで284Bって凄いな。でも品質は大丈夫なのか？
  - 2025年2月12日 6:08 AM #61182 返信
    
    名無しさん
    
    実際に使ってみた人の話だと、コード生成とかなら十分実用的らしい。ただし日本語は微妙かも。
- 2025年2月12日 6:12 AM #61183 返信
  
  名無しさん
  
  128GB Macでも動くのか…メモリ食いすぎでしょ。うちの64GBじゃ無理だな。
  - 2025年2月12日 6:19 AM #61184 返信
    
    名無しさん
    
    32GBでもなんとか動くモデルあるけど、速度は犠牲になるね。
- 2025年2月12日 6:21 AM #61185 返信
  
  名無しさん
  
  GLM-4.5-Airって聞いたことないけど、中国のモデル？
  - 2025年2月12日 6:25 AM #61186 返信
    
    名無しさん
    
    そう、Zhipu AIのモデル。6bitでもメモリは食うけど、DeepSeekの方がコスパ良さそう。
- 2025年2月12日 6:31 AM #61187 返信
  
  名無しさん
  
  2bitって極端だけど、ベンチマークではどうなんだろう。自分はllama.cppで4bit使ってる。
  - 2025年2月12日 6:40 AM #61188 返信
    
    名無しさん
    
    スレ主のテストではDeepSeekの方が性能良かったらしい。でも2bitはさすがに情報落ちが心配。
- 2025年2月12日 6:41 AM #61189 返信
  
  名無しさん
  
  こんな大規模モデルをローカルで動かす意味ある？API使った方が安くない？
  - 2025年2月12日 6:44 AM #61190 返信
    
    名無しさん
    
    プライバシー重視ならローカル一択。それに一度動かせばタダだし。
    - 2025年2月12日 6:48 AM #61191 返信
      
      名無しさん
      
      電気代考えたら？まあ趣味の世界だよね。
- 2025年2月12日 6:54 AM #61192 返信
  
  名無しさん
  
  Macで動かすメリットってあるの？CUDA使えないし。
  - 2025年2月12日 7:06 AM #61193 返信
    
    名無しさん
    
    Metal対応でそこそこ速いよ。それにメモリ統一だから大容量モデル向き。
- 2025年2月12日 7:07 AM #61194 返信
  
  名無しさん
  
  DeepSeek V4 Flashってチャット向け？コード向け？使い分けが知りたい。
  - 2025年2月12日 7:10 AM #61195 返信
    
    名無しさん
    
    両方いけるみたい。ただ指示によっては変な応答もあるってレビューあった。
投稿者

投稿

15件の返信を表示中（うち親返信7件）

返信先: GLM-4.5-Air 6bit vs DeepSeek V4 Flash 284B 2bit、128GB Macで比較したら2bitの方が勝ったらしいで#61188に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック