- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより12ヶ月前に更新されました。
19件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっていたスレッド「Can two Mac Studio 512GB run the Deepseek V4 Pro model?」を元に議論しましょう。DeepSeek V4 Proは巨大モデルなので、Mac Studioを2台連結して動かせるのか?メモリ帯域や推論速度、コスト面など様々な意見が出ていました。現実的な選択肢かどうか、皆さんの考えを聞かせてください。
-
名無しさんV4 Proってどのくらいのパラメータ数だっけ?1Bとかじゃ無理だよね。
-
名無しさん確かV4 Proは671BのMoEだから、アクティブパラメータは37B程度だったはず。メモリ要件は高いけど、量子化すればいけるかも。
-
名無しさん量子化4bitならメモリは250GBくらいで収まるらしい。2台で余裕か。ただし速度は未知数。
-
名無しさん4bit量子化でも推論速度が実用的かどうかが問題。Mac StudioのGPUはNVIDIAほど強くないし。
-
-
-
-
名無しさん2台のMac Studioで512GBずつってことは合計1TBのユニファイドメモリだけど、モデルのサイズ次第じゃギリギリかも。
-
名無しさん問題は帯域だよね。Mac Studioのメモリ帯域は800GB/sだけど、2台だとネットワーク越しになるから遅くなる。
-
名無しさんInfiniBandとかで接続すれば帯域問題は多少改善されるけど、一般ユーザーには非現実的。
-
名無しさんネットワーク経由の推論は遅すぎて実用的じゃないってRedditで言ってた。1台でやれるモデルにした方がいいと思う。
-
-
-
名無しさんコスト面ではMac Studio2台で100万超えそう。それならクラウドでレンタルした方が安くない?
-
名無しさんでもプライバシー重視ならローカルに越したことはない。データを外部に出したくない人には価値あるかも。
-
名無しさんプライバシーは確かに大事。契約書や機密コードを扱うならローカル一択だよ。
-
-
-
名無しさんそもそもDeepSeek V4 Proって本当に公開されるの?中国の規制とかで遅れてるって話もあるけど。
-
名無しさんV4はもう出てるよ。Pro版はまだだけど、近いうちに出るって噂。
-
-
名無しさんコード生成に使いたいなら、そもそもMacで動かすよりAPI使った方が簡単じゃね?
-
名無しさんでもAPIだとレイテンシとコストが気になる。ローカルなら無限に使えるもんな。
-
-
名無しさんMac Studioのファン音がうるさくなるって話もある。2台だと冷却大丈夫かな。
-
名無しさん負荷かけるとファンは回るけど、個人的には気にならないレベル。でも2台だとさらにうるさいかも。
-
-
名無しさんもし試すならllama.cppの分散推論機能が使えるかも。設定が面倒だけど。
-
名無しさん自分は試したことないけど、LLaMA系の分散はまだ不安定って聞く。安定性重視なら素直に一台で収まるモデルが無難。
-
-
-
投稿者投稿
19件の返信を表示中(うち親返信7件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01