- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
19件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっていたスレッド「Can two Mac Studio 512GB run the Deepseek V4 Pro model?」を元に議論しましょう。DeepSeek V4 Proは巨大モデルなので、Mac Studioを2台連結して動かせるのか?メモリ帯域や推論速度、コスト面など様々な意見が出ていました。現実的な選択肢かどうか、皆さんの考えを聞かせてください。
ソース: https://www.reddit.com/r/LocalLLaMA/comments/1t19ohv/can_two_mac_studio_512gb_run_the_deepseek_v4_pro/ -
名無しさんV4 Proってどのくらいのパラメータ数だっけ?1Bとかじゃ無理だよね。
-
名無しさん確かV4 Proは671BのMoEだから、アクティブパラメータは37B程度だったはず。メモリ要件は高いけど、量子化すればいけるかも。
-
名無しさん量子化4bitならメモリは250GBくらいで収まるらしい。2台で余裕か。ただし速度は未知数。
-
名無しさん4bit量子化でも推論速度が実用的かどうかが問題。Mac StudioのGPUはNVIDIAほど強くないし。
-
-
-
-
名無しさん2台のMac Studioで512GBずつってことは合計1TBのユニファイドメモリだけど、モデルのサイズ次第じゃギリギリかも。
-
名無しさん問題は帯域だよね。Mac Studioのメモリ帯域は800GB/sだけど、2台だとネットワーク越しになるから遅くなる。
-
名無しさんInfiniBandとかで接続すれば帯域問題は多少改善されるけど、一般ユーザーには非現実的。
-
名無しさんネットワーク経由の推論は遅すぎて実用的じゃないってRedditで言ってた。1台でやれるモデルにした方がいいと思う。
-
-
-
名無しさんコスト面ではMac Studio2台で100万超えそう。それならクラウドでレンタルした方が安くない?
-
名無しさんでもプライバシー重視ならローカルに越したことはない。データを外部に出したくない人には価値あるかも。
-
名無しさんプライバシーは確かに大事。契約書や機密コードを扱うならローカル一択だよ。
-
-
-
名無しさんそもそもDeepSeek V4 Proって本当に公開されるの?中国の規制とかで遅れてるって話もあるけど。
-
名無しさんV4はもう出てるよ。Pro版はまだだけど、近いうちに出るって噂。
-
-
名無しさんコード生成に使いたいなら、そもそもMacで動かすよりAPI使った方が簡単じゃね?
-
名無しさんでもAPIだとレイテンシとコストが気になる。ローカルなら無限に使えるもんな。
-
-
名無しさんMac Studioのファン音がうるさくなるって話もある。2台だと冷却大丈夫かな。
-
名無しさん負荷かけるとファンは回るけど、個人的には気にならないレベル。でも2台だとさらにうるさいかも。
-
-
名無しさんもし試すならllama.cppの分散推論機能が使えるかも。設定が面倒だけど。
-
名無しさん自分は試したことないけど、LLaMA系の分散はまだ不安定って聞く。安定性重視なら素直に一台で収まるモデルが無難。
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44