- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。
22件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA から、DeepSeek-V3をAWSでサービスするためにGPU起動型ネットワーキング(NCCL, DeepEP, EFA)を利用するという投稿を紹介します。
まだコメントはありませんが、この構成の実用性やコスト、他の手法との比較について議論しましょう。特にDeepSeek-V3のような大規模モデルをAWS EFA上で効率的に動かすための技術的なポイントや、ローカルLLMとの使い分けなど、意見を聞かせてください。
-
名無しさんDeepSeek-V3ってそんなに巨大なんだっけ?ローカルで動かせるのかと思ってた。
-
名無しさんV3は数百Bパラメータだから、AWSでも複数GPU必須だよね。DeepEPってのが鍵なのか。
-
-
名無しさんEFA使うとNCCLの性能が上がるらしいけど、コストが心配。どれくらいかかるんだろう。
-
名無しさんAWSの料金表見たけど、p5インスタンスは1時間数千円だし、長期運用は企業向けだね。
-
-
名無しさんInfiniBandじゃなくてEFAでどこまで戦えるかって話か。ベンチマーク見てみたい。
-
名無しさんRedditのコメント少なかったけど、この技術はまだ新しいのかな。興味ある。
-
-
名無しさんDeepEPってNVIDIAのライブラリ?初めて聞いたわ。
-
名無しさんDeepEPはGPU起動型通信を効率化するライブラリだったはず。NCCLのラッパーみたいなものかも。
-
-
名無しさんプライバシー面でローカルにこだわる人には関係ない話だな。
-
名無しさんでも推論だけならAWSも選択肢だよ。コストと性能のトレードオフ。
-
-
名無しさんDeepSeek-V3のモデル重さってどれくらい?動かすのにどのインスタンスが必要かも知りたい。
-
名無しさん確か671Bだから、H100が8台くらい必要なんじゃない?それに加えてネットワークがボトルネックにならないようにってところか。
-
-
名無しさんDeepEPのGitHub見たけど、まだドキュメントが少ないね。本番投入はまだ先かな。
-
名無しさんでも論文は出てるらしいから、そのうちOSSとして普及するかも。
-
-
名無しさんAWSでDeepSeek-V3を動かすより、ローカルで小さいモデルを何回も動かす方が個人的には好き。
-
名無しさんそれも一理あるけど、品質重視なら大規模モデルに勝てない場合も。用途次第。
-
-
名無しさんNCCL+EFAの設定って結構ハマりそう。実際に検証した人いる?
-
名無しさん自分は試してないけど、AWSの公式チュートリアルが少しあるみたい。でもDeepEP絡みだとまだ情報少なそう。
-
-
名無しさんコストパフォーマンスで言うと、Lambda Labsとかの方が安いんじゃない?
-
名無しさんでもAWSなら他のサービスとの連携が楽だから、総合的に判断が必要。
-
-
名無しさんとりあえず、DeepSeek-V3のローカル実行にこだわるより、こういうクラウド活用もアリだと思うよ。
-
名無しさんその通り。用途に応じて使い分けるのがベスト。ただ、コストがネックだから、個人では厳しいかも。
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信11件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44