DeepSeek V4 Proを2台のMac Studio 512GBで動かせるか?

掲示板 フォーラム AI DeepSeek V4 Proを2台のMac Studio 512GBで動かせるか?

  • このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより12ヶ月前に更新されました。
19件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #63165 返信
      名無しさん
      Redditのr/LocalLLaMAで話題になっていたスレッド「Can two Mac Studio 512GB run the Deepseek V4 Pro model?」を元に議論しましょう。DeepSeek V4 Proは巨大モデルなので、Mac Studioを2台連結して動かせるのか?メモリ帯域や推論速度、コスト面など様々な意見が出ていました。現実的な選択肢かどうか、皆さんの考えを聞かせてください。

    • #63166 返信
      名無しさん
      V4 Proってどのくらいのパラメータ数だっけ?1Bとかじゃ無理だよね。

      • #63168 返信
        名無しさん
        確かV4 Proは671BのMoEだから、アクティブパラメータは37B程度だったはず。メモリ要件は高いけど、量子化すればいけるかも。

        • #63171 返信
          名無しさん
          量子化4bitならメモリは250GBくらいで収まるらしい。2台で余裕か。ただし速度は未知数。

          • #63176 返信
            名無しさん
            4bit量子化でも推論速度が実用的かどうかが問題。Mac StudioのGPUはNVIDIAほど強くないし。

    • #63167 返信
      名無しさん
      2台のMac Studioで512GBずつってことは合計1TBのユニファイドメモリだけど、モデルのサイズ次第じゃギリギリかも。

      • #63169 返信
        名無しさん
        問題は帯域だよね。Mac Studioのメモリ帯域は800GB/sだけど、2台だとネットワーク越しになるから遅くなる。

        • #63172 返信
          名無しさん
          InfiniBandとかで接続すれば帯域問題は多少改善されるけど、一般ユーザーには非現実的。

        • #63182 返信
          名無しさん
          ネットワーク経由の推論は遅すぎて実用的じゃないってRedditで言ってた。1台でやれるモデルにした方がいいと思う。

    • #63170 返信
      名無しさん
      コスト面ではMac Studio2台で100万超えそう。それならクラウドでレンタルした方が安くない?

      • #63173 返信
        名無しさん
        でもプライバシー重視ならローカルに越したことはない。データを外部に出したくない人には価値あるかも。

        • #63179 返信
          名無しさん
          プライバシーは確かに大事。契約書や機密コードを扱うならローカル一択だよ。

    • #63174 返信
      名無しさん
      そもそもDeepSeek V4 Proって本当に公開されるの?中国の規制とかで遅れてるって話もあるけど。

      • #63175 返信
        名無しさん
        V4はもう出てるよ。Pro版はまだだけど、近いうちに出るって噂。

    • #63177 返信
      名無しさん
      コード生成に使いたいなら、そもそもMacで動かすよりAPI使った方が簡単じゃね?

      • #63178 返信
        名無しさん
        でもAPIだとレイテンシとコストが気になる。ローカルなら無限に使えるもんな。

    • #63180 返信
      名無しさん
      Mac Studioのファン音がうるさくなるって話もある。2台だと冷却大丈夫かな。

      • #63181 返信
        名無しさん
        負荷かけるとファンは回るけど、個人的には気にならないレベル。でも2台だとさらにうるさいかも。

    • #63183 返信
      名無しさん
      もし試すならllama.cppの分散推論機能が使えるかも。設定が面倒だけど。

      • #63184 返信
        名無しさん
        自分は試したことないけど、LLaMA系の分散はまだ不安定って聞く。安定性重視なら素直に一台で収まるモデルが無難。

19件の返信を表示中(うち親返信7件)
返信先: DeepSeek V4 Proを2台のMac Studio 512GBで動かせるか?で#63177に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました