DeepSeek R1を5ノードGPUクラスタ＋Cloudflare Tunnelで動かしてみた教訓

名無しさん · 2025-02-23T19:21:41+09:00

話題を拾いました。DeepSeek R1（推論強化モデル）を5ノードのGPUクラスタで動かし、Cloudflare Tunnel経由で外部公開したという構築レポートです。クラスタ構成やレイテンシ対策、コスト感、プライバシー管理など、実運用ならではの知見が共有されていました。

このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。

19件の返信を表示中（うち親返信9件）

投稿者

投稿
- 2025年2月23日 7:21 PM #62985 返信
  
  名無しさん
  
  話題を拾いました。DeepSeek R1（推論強化モデル）を5ノードのGPUクラスタで動かし、Cloudflare Tunnel経由で外部公開したという構築レポートです。クラスタ構成やレイテンシ対策、コスト感、プライバシー管理など、実運用ならではの知見が共有されていました。
- 2025年2月23日 7:23 PM #62986 返信
  
  名無しさん
  
  5ノードって結構大がかりだな。自宅でやってるの？
  - 2025年2月23日 7:30 PM #62988 返信
    
    名無しさん
    
    記事見た感じだとラボか小さな会社のクラウドリっぽい。自宅で5ノードは電力や冷却が大変だろ。
- 2025年2月23日 7:26 PM #62987 返信
  
  名無しさん
  
  Cloudflare Tunnel使えば外部公開も安全そうでいいね。社内向けのモデル運用にも応用できそう。
- 2025年2月23日 7:37 PM #62989 返信
  
  名無しさん
  
  DeepSeek R1って確かChain-of-Thoughtを内部でやってるんだっけ。推論時間が長くなりそう。
  - 2025年2月23日 7:39 PM #62990 返信
    
    名無しさん
    
    そうそう、でも最近の最適化で結構速くなってるらしい。クラスタで並列化すれば実用レベルかも。
- 2025年2月23日 7:43 PM #62991 返信
  
  名無しさん
  
  検閲バイアスの話よく出るけど、実際どうなの？ファインチューニングで緩和できる？
  - 2025年2月23日 7:49 PM #62992 返信
    
    名無しさん
    
    Redditのコメント見る限り、結構ガードレール強いみたい。政治系の話題だと拒否されることがあるって。
    - 2025年2月23日 7:58 PM #62993 返信
      
      名無しさん
      
      まあローカルで動かせば好きにファインチューンできるし、カスタマイズ前提なら問題ないんじゃね？
- 2025年2月23日 7:59 PM #62994 返信
  
  名無しさん
  
  コスト気になる。GPUクラスタ5台でどのくらい電気代かかるんだろ。
  - 2025年2月23日 8:02 PM #62995 返信
    
    名無しさん
    
    A100とかH100なら馬鹿にならないな。でもV100クラスなら意外と抑えられるかも。記事では具体的な数字なかった。
- 2025年2月23日 8:06 PM #62996 返信
  
  名無しさん
  
  Cloudflare Tunnel経由ってことはレイテンシーどうなの？推論時の応答速度が気になる。
  - 2025年2月23日 8:12 PM #62997 返信
    
    名無しさん
    
    試した人の話だと、Direct接続と比べて数十ms増える程度で気にならないそうだ。エッジでキャッシュ効くしね。
    - 2025年2月23日 8:24 PM #62998 返信
      
      名無しさん
      
      でもトークン生成速度はモデル次第だし、長文だと結構待つよ。私の環境ではR1 8Bで1トークン0.1秒くらい。
- 2025年2月23日 8:25 PM #62999 返信
  
  名無しさん
  
  5ノードもいるならLlama 3 70Bとかも余裕で動くんじゃない？わざわざR1にした理由が知りたい。
  - 2025年2月23日 8:28 PM #63000 返信
    
    名無しさん
    
    正確性重視のタスクだとR1の推論チェインが有利らしい。コード生成とか数学問題で差が出るみたい。
    - 2025年2月23日 8:33 PM #63001 返信
      
      名無しさん
      
      なるほど。でもベンチマークだけじゃ実用差は微妙って意見もあったよ。
- 2025年2月23日 8:41 PM #63002 返信
  
  名無しさん
  
  このスレ見て自分も試したくなったけど、まずはシングルノードでR1の軽量版から入ろう。
  - 2025年2月23日 8:43 PM #63003 返信
    
    名無しさん
    
    おすすめはDeepSeek R1 Distill 7B。結構賢いし、VRAM 8GBでも動く。
- 2025年2月23日 8:47 PM #63004 返信
  
  名無しさん
  
  Redditのスレだと「検閲が気になるならLlama使え」とか「APIより安上がり」とか色々意見あって面白かった。
投稿者

投稿

19件の返信を表示中（うち親返信9件）

返信先: DeepSeek R1を5ノードGPUクラスタ＋Cloudflare Tunnelで動かしてみた教訓で#62989に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック