DeepSeek R1を5ノードGPUクラスタ+Cloudflare Tunnelで動かしてみた教訓

掲示板 フォーラム AI DeepSeek R1を5ノードGPUクラスタ+Cloudflare Tunnelで動かしてみた教訓

  • このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
19件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #62985 返信
      名無しさん
      話題を拾いました。DeepSeek R1(推論強化モデル)を5ノードのGPUクラスタで動かし、Cloudflare Tunnel経由で外部公開したという構築レポートです。クラスタ構成やレイテンシ対策、コスト感、プライバシー管理など、実運用ならではの知見が共有されていました。

    • #62986 返信
      名無しさん
      5ノードって結構大がかりだな。自宅でやってるの?

      • #62988 返信
        名無しさん
        記事見た感じだとラボか小さな会社のクラウドリっぽい。自宅で5ノードは電力や冷却が大変だろ。

    • #62987 返信
      名無しさん
      Cloudflare Tunnel使えば外部公開も安全そうでいいね。社内向けのモデル運用にも応用できそう。

    • #62989 返信
      名無しさん
      DeepSeek R1って確かChain-of-Thoughtを内部でやってるんだっけ。推論時間が長くなりそう。

      • #62990 返信
        名無しさん
        そうそう、でも最近の最適化で結構速くなってるらしい。クラスタで並列化すれば実用レベルかも。

    • #62991 返信
      名無しさん
      検閲バイアスの話よく出るけど、実際どうなの?ファインチューニングで緩和できる?

      • #62992 返信
        名無しさん
        Redditのコメント見る限り、結構ガードレール強いみたい。政治系の話題だと拒否されることがあるって。

        • #62993 返信
          名無しさん
          まあローカルで動かせば好きにファインチューンできるし、カスタマイズ前提なら問題ないんじゃね?

    • #62994 返信
      名無しさん
      コスト気になる。GPUクラスタ5台でどのくらい電気代かかるんだろ。

      • #62995 返信
        名無しさん
        A100とかH100なら馬鹿にならないな。でもV100クラスなら意外と抑えられるかも。記事では具体的な数字なかった。

    • #62996 返信
      名無しさん
      Cloudflare Tunnel経由ってことはレイテンシーどうなの?推論時の応答速度が気になる。

      • #62997 返信
        名無しさん
        試した人の話だと、Direct接続と比べて数十ms増える程度で気にならないそうだ。エッジでキャッシュ効くしね。

        • #62998 返信
          名無しさん
          でもトークン生成速度はモデル次第だし、長文だと結構待つよ。私の環境ではR1 8Bで1トークン0.1秒くらい。

    • #62999 返信
      名無しさん
      5ノードもいるならLlama 3 70Bとかも余裕で動くんじゃない?わざわざR1にした理由が知りたい。

      • #63000 返信
        名無しさん
        正確性重視のタスクだとR1の推論チェインが有利らしい。コード生成とか数学問題で差が出るみたい。

        • #63001 返信
          名無しさん
          なるほど。でもベンチマークだけじゃ実用差は微妙って意見もあったよ。

    • #63002 返信
      名無しさん
      このスレ見て自分も試したくなったけど、まずはシングルノードでR1の軽量版から入ろう。

      • #63003 返信
        名無しさん
        おすすめはDeepSeek R1 Distill 7B。結構賢いし、VRAM 8GBでも動く。

    • #63004 返信
      名無しさん
      Redditのスレだと「検閲が気になるならLlama使え」とか「APIより安上がり」とか色々意見あって面白かった。

19件の返信を表示中(うち親返信9件)
返信先: DeepSeek R1を5ノードGPUクラスタ+Cloudflare Tunnelで動かしてみた教訓で#62994に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました