RTX 6000 PROを4～8枚で大規模モデル運用してる人、実際どう？GLM 5.2、Kimi 2.7、DeepSeek V4 Proとか

名無しさん · 2025-09-29T15:54:27+09:00

Redditのr/LocalLLaMAで、4～8枚のRTX 6000 PROを使ってGLM 5.2やKimi 2.7、DeepSeek V4 Proのような大規模モデルを動かしているユーザーの体験談が話題になっていました。マルチGPUのメモリ効率や速度、コスト面、プライバシーまで幅広い意見が交わされています。ここでも同じ環境の人の感想を聞きたいです。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1uex6pb/for_users_with_4x8x_6000_pros_how_is_your/

このトピックには18件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月、 4週前に更新されました。

18件の返信を表示中（うち親返信9件）

投稿者

投稿
- 2025年9月29日 3:54 PM #61051 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、4～8枚のRTX 6000 PROを使ってGLM 5.2やKimi 2.7、DeepSeek V4 Proのような大規模モデルを動かしているユーザーの体験談が話題になっていました。マルチGPUのメモリ効率や速度、コスト面、プライバシーまで幅広い意見が交わされています。ここでも同じ環境の人の感想を聞きたいです。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1uex6pb/for_users_with_4x8x_6000_pros_how_is_your/
- 2025年9月29日 3:56 PM #61052 返信
  
  名無しさん
  
  自分は4枚でDeepSeek V4 Proを動かしてる。推論速度はまあまあだけど、VRAMがギリギリ。
- 2025年9月29日 3:59 PM #61053 返信
  
  名無しさん
  
  Kimi 2.7って本当に使えるの？中国製は不安。
  - 2025年9月29日 4:03 PM #61054 返信
    
    名無しさん
    
    ベンチマークは結構いいよ。ただ量子化しないと6枚でも厳しいかも。
- 2025年9月29日 4:10 PM #61055 返信
  
  名無しさん
  
  GLM 5.2は会話精度が高いけど、推論に時間がかかる。コスパ考えるとAPI使った方が安い説もある。
  - 2025年9月29日 4:12 PM #61056 返信
    
    名無しさん
    
    でもAPIだとデータが漏れるリスクあるから、ローカルで動かす意味は大きいよね。
    - 2025年9月29日 4:15 PM #61057 返信
      
      名無しさん
      
      その点、6000 PROはECCメモリだし、安定して長時間運用できるのが強み。
- 2025年9月29日 4:21 PM #61058 返信
  
  名無しさん
  
  自分は8枚構成だけど、電気代がやばい。エアコンもフル稼働で夏は熱中症になりそう。
  - 2025年9月29日 4:30 PM #61059 返信
    
    名無しさん
    
    わかる。マルチGPUは冷却が命。水冷にしたらだいぶマシになった。
- 2025年9月29日 4:32 PM #61060 返信
  
  名無しさん
  
  6000 PROの価格高すぎるよ。A6000とか中古でもいいかな。
  - 2025年9月29日 4:34 PM #61061 返信
    
    名無しさん
    
    A6000でも大抵のモデルは動く。ただNVLink使えないからバッチサイズで工夫が必要。
- 2025年9月29日 4:38 PM #61062 返信
  
  名無しさん
  
  DeepSeek V4 Proって実際のコード生成どう？噂だと数学は得意らしいけど。
  - 2025年9月29日 4:45 PM #61063 返信
    
    名無しさん
    
    簡単なスクリプトならかなり正確。でも複雑なロジックはまだ怪しい。
- 2025年9月29日 4:56 PM #61064 返信
  
  名無しさん
  
  こういう大きいモデル、16ビットじゃなくて8ビット量子化で動かすとどれくらい劣化するの？
  - 2025年9月29日 4:58 PM #61065 返信
    
    名無しさん
    
    4bitなら体感誤差。8bitでも知能が落ちた感じはしない。VRAM節約になるしおすすめ。
- 2025年9月29日 5:01 PM #61066 返信
  
  名無しさん
  
  Kimi 2.7の日本語性能、試した人いる？GLMより自然かもと聞いた。
  - 2025年9月29日 5:06 PM #61067 返信
    
    名無しさん
    
    自分はKimiで日本語チャットさせてるけど、たまに中国語混ざる。でも会話は滑らか。
- 2025年9月29日 5:13 PM #61068 返信
  
  名無しさん
  
  結局、今一番コスパいいモデルってどれ？Llama 4とかも出てるし。
  - 2025年9月29日 5:16 PM #61069 返信
    
    名無しさん
    
    Llama 4はまだ日本語弱い。DeepSeekかQwenの最新版が無難かな。6000 PROなら両方動く。
投稿者

投稿

18件の返信を表示中（うち親返信9件）

返信先: RTX 6000 PROを4～8枚で大規模モデル運用してる人、実際どう？GLM 5.2、Kimi 2.7、DeepSeek V4 Proとかで#61052に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック