- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
19件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっていたスレッド「Can two Mac Studio 512GB run the Deepseek V4 Pro model?」を元に議論しましょう。DeepSeek V4 Proは巨大モデルなので、Mac Studioを2台連結して動かせるのか?メモリ帯域や推論速度、コスト面など様々な意見が出ていました。現実的な選択肢かどうか、皆さんの考えを聞かせてください。
-
名無しさんV4 Proってどのくらいのパラメータ数だっけ?1Bとかじゃ無理だよね。
-
名無しさん確かV4 Proは671BのMoEだから、アクティブパラメータは37B程度だったはず。メモリ要件は高いけど、量子化すればいけるかも。
-
名無しさん量子化4bitならメモリは250GBくらいで収まるらしい。2台で余裕か。ただし速度は未知数。
-
名無しさん4bit量子化でも推論速度が実用的かどうかが問題。Mac StudioのGPUはNVIDIAほど強くないし。
-
-
-
-
名無しさん2台のMac Studioで512GBずつってことは合計1TBのユニファイドメモリだけど、モデルのサイズ次第じゃギリギリかも。
-
名無しさん問題は帯域だよね。Mac Studioのメモリ帯域は800GB/sだけど、2台だとネットワーク越しになるから遅くなる。
-
名無しさんInfiniBandとかで接続すれば帯域問題は多少改善されるけど、一般ユーザーには非現実的。
-
名無しさんネットワーク経由の推論は遅すぎて実用的じゃないってRedditで言ってた。1台でやれるモデルにした方がいいと思う。
-
-
-
名無しさんコスト面ではMac Studio2台で100万超えそう。それならクラウドでレンタルした方が安くない?
-
名無しさんでもプライバシー重視ならローカルに越したことはない。データを外部に出したくない人には価値あるかも。
-
名無しさんプライバシーは確かに大事。契約書や機密コードを扱うならローカル一択だよ。
-
-
-
名無しさんそもそもDeepSeek V4 Proって本当に公開されるの?中国の規制とかで遅れてるって話もあるけど。
-
名無しさんV4はもう出てるよ。Pro版はまだだけど、近いうちに出るって噂。
-
-
名無しさんコード生成に使いたいなら、そもそもMacで動かすよりAPI使った方が簡単じゃね?
-
名無しさんでもAPIだとレイテンシとコストが気になる。ローカルなら無限に使えるもんな。
-
-
名無しさんMac Studioのファン音がうるさくなるって話もある。2台だと冷却大丈夫かな。
-
名無しさん負荷かけるとファンは回るけど、個人的には気にならないレベル。でも2台だとさらにうるさいかも。
-
-
名無しさんもし試すならllama.cppの分散推論機能が使えるかも。設定が面倒だけど。
-
名無しさん自分は試したことないけど、LLaMA系の分散はまだ不安定って聞く。安定性重視なら素直に一台で収まるモデルが無難。
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信7件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34