DeepSeek 671Bをllama.cppで8xRTX PRO 6000Sで動かしたベンチマーク結果

名無しさん · 2025-04-24T19:55:36+09:00

Redditのr/LocalLLaMAで、DeepSeek 671Bモデルをllama.cppで8枚のRTX PRO 6000S GPUを使ってレイヤースプリットモードで動かしたベンチマーク結果が投稿されていました。スコア15、コメント31件のスレッドです。実際のパフォーマンスやメモリ使用量、推論速度などが議論されています。詳しくはッドをご覧ください。

このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。

13件の返信を表示中（うち親返信6件）

投稿者

投稿
- 2025年4月24日 7:55 PM #72169 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek 671Bモデルをllama.cppで8枚のRTX PRO 6000S GPUを使ってレイヤースプリットモードで動かしたベンチマーク結果が投稿されていました。スコア15、コメント31件のスレッドです。実際のパフォーマンスやメモリ使用量、推論速度などが議論されています。詳しくはッドをご覧ください。
- 2025年4月24日 7:57 PM #72170 返信
  
  名無しさん
  
  8枚のPRO 6000Sって凄いな。でも実際に動かすとなると電気代や冷却が大変そうだ。
  - 2025年4月24日 8:04 PM #72172 返信
    
    名無しさん
    
    >>2 ああ、GPU8枚ともなると消費電力ヤバいよな。普通の企業じゃ導入無理だわ。
- 2025年4月24日 8:00 PM #72171 返信
  
  名無しさん
  
  671Bパラメータのモデルをローカルで動かせる時代が来たんだな。量子化なしでも動くのか？
  - 2025年4月24日 8:11 PM #72173 返信
    
    名無しさん
    
    >>3 たぶん量子化してると思う。フル精度だとVRAMが全然足りないはず。
- 2025年4月24日 8:13 PM #72174 返信
  
  名無しさん
  
  llama.cppのレイヤースプリットモードって安定してるの？前に試した時はエラーで動かなかった。
  - 2025年4月24日 8:17 PM #72175 返信
    
    名無しさん
    
    >>6 最近のアップデートで改善されてるらしいよ。自分は4枚の3090で動かせてる。
- 2025年4月24日 8:23 PM #72176 返信
  
  名無しさん
  
  DeepSeekってコーディング向けらしいけど、実際のコード生成の品質はどうなんだろう？
  - 2025年4月24日 8:32 PM #72177 返信
    
    名無しさん
    
    >>8 自分が試した感じだと、GPT-4レベルとは言わないけどかなり使えるよ。特にPythonは得意みたい。
  - 2025年4月24日 8:33 PM #72178 返信
    
    名無しさん
    
    >>8 でも時々変なコード吐くから注意が必要。レビューは必須だな。
- 2025年4月24日 8:35 PM #72179 返信
  
  名無しさん
  
  ベンチマークの数字だけ見ても実用性は分からない。実際に動かす環境による差が大きい。
  - 2025年4月24日 8:39 PM #72180 返信
    
    名無しさん
    
    >>11 そうそう。推論速度よりもメモリ帯域やバッチサイズの影響が大きいよね。
- 2025年4月24日 8:46 PM #72181 返信
  
  名無しさん
  
  この規模のモデルを自宅で動かすのは夢のまた夢だな。クラウドAPIで十分だわ。
  - 2025年4月24日 8:57 PM #72182 返信
    
    名無しさん
    
    >>13 でもプライバシーが気になる時はローカルが必要だし、コスト次第では選択肢になるかも。
投稿者

投稿

13件の返信を表示中（うち親返信6件）

返信先: DeepSeek 671Bをllama.cppで8xRTX PRO 6000Sで動かしたベンチマーク結果で#72176に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック