DeepSeek-V3をAWSで動かすためのGPUネットワーキング(NCCL+DeepEP+EFA)の話題

名無しさん · 2025-11-22T14:20:02+09:00

Reddit r/LocalLLaMA から、DeepSeek-V3をAWSでサービスするためにGPU起動型ネットワーキング（NCCL, DeepEP, EFA）を利用するという投稿を紹介します。元の投稿: https://www.reddit.com/r/LocalLLaMA/comments/1rc19w5/gpuinitiated_networking_for_nccl_on_aws_serving/ まだコメントはありませんが、この構成の実用性やコスト、他の手法との比較について議論しましょう。特にDeepSeek-V3のような大規模モデルをAWS EFA上で効率的に動かすための技術的なポイントや、ローカルLLMとの使い分けなど、意見を聞かせてください。

このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。

22件の返信を表示中（うち親返信11件）

投稿者

投稿
- 2025年11月22日 2:20 PM #69275 返信
  
  名無しさん
  
  Reddit r/LocalLLaMA から、DeepSeek-V3をAWSでサービスするためにGPU起動型ネットワーキング（NCCL, DeepEP, EFA）を利用するという投稿を紹介します。
  
  元の投稿: https://www.reddit.com/r/LocalLLaMA/comments/1rc19w5/gpuinitiated_networking_for_nccl_on_aws_serving/
  
  まだコメントはありませんが、この構成の実用性やコスト、他の手法との比較について議論しましょう。特にDeepSeek-V3のような大規模モデルをAWS EFA上で効率的に動かすための技術的なポイントや、ローカルLLMとの使い分けなど、意見を聞かせてください。
- 2025年11月22日 2:21 PM #69276 返信
  
  名無しさん
  
  DeepSeek-V3ってそんなに巨大なんだっけ？ローカルで動かせるのかと思ってた。
  - 2025年11月22日 2:28 PM #69278 返信
    
    名無しさん
    
    V3は数百Bパラメータだから、AWSでも複数GPU必須だよね。DeepEPってのが鍵なのか。
- 2025年11月22日 2:24 PM #69277 返信
  
  名無しさん
  
  EFA使うとNCCLの性能が上がるらしいけど、コストが心配。どれくらいかかるんだろう。
  - 2025年11月22日 2:37 PM #69280 返信
    
    名無しさん
    
    AWSの料金表見たけど、p5インスタンスは1時間数千円だし、長期運用は企業向けだね。
- 2025年11月22日 2:35 PM #69279 返信
  
  名無しさん
  
  InfiniBandじゃなくてEFAでどこまで戦えるかって話か。ベンチマーク見てみたい。
  - 2025年11月22日 3:00 PM #69285 返信
    
    名無しさん
    
    Redditのコメント少なかったけど、この技術はまだ新しいのかな。興味ある。
- 2025年11月22日 2:41 PM #69281 返信
  
  名無しさん
  
  DeepEPってNVIDIAのライブラリ？初めて聞いたわ。
  - 2025年11月22日 2:47 PM #69282 返信
    
    名無しさん
    
    DeepEPはGPU起動型通信を効率化するライブラリだったはず。NCCLのラッパーみたいなものかも。
- 2025年11月22日 2:56 PM #69283 返信
  
  名無しさん
  
  プライバシー面でローカルにこだわる人には関係ない話だな。
  - 2025年11月22日 2:57 PM #69284 返信
    
    名無しさん
    
    でも推論だけならAWSも選択肢だよ。コストと性能のトレードオフ。
- 2025年11月22日 3:04 PM #69286 返信
  
  名無しさん
  
  DeepSeek-V3のモデル重さってどれくらい？動かすのにどのインスタンスが必要かも知りたい。
  - 2025年11月22日 3:10 PM #69287 返信
    
    名無しさん
    
    確か671Bだから、H100が8台くらい必要なんじゃない？それに加えてネットワークがボトルネックにならないようにってところか。
- 2025年11月22日 3:22 PM #69288 返信
  
  名無しさん
  
  DeepEPのGitHub見たけど、まだドキュメントが少ないね。本番投入はまだ先かな。
  - 2025年11月22日 3:24 PM #69289 返信
    
    名無しさん
    
    でも論文は出てるらしいから、そのうちOSSとして普及するかも。
- 2025年11月22日 3:27 PM #69290 返信
  
  名無しさん
  
  AWSでDeepSeek-V3を動かすより、ローカルで小さいモデルを何回も動かす方が個人的には好き。
  - 2025年11月22日 3:31 PM #69291 返信
    
    名無しさん
    
    それも一理あるけど、品質重視なら大規模モデルに勝てない場合も。用途次第。
- 2025年11月22日 3:39 PM #69292 返信
  
  名無しさん
  
  NCCL+EFAの設定って結構ハマりそう。実際に検証した人いる？
  - 2025年11月22日 3:41 PM #69293 返信
    
    名無しさん
    
    自分は試してないけど、AWSの公式チュートリアルが少しあるみたい。でもDeepEP絡みだとまだ情報少なそう。
- 2025年11月22日 3:45 PM #69294 返信
  
  名無しさん
  
  コストパフォーマンスで言うと、Lambda Labsとかの方が安いんじゃない？
  - 2025年11月22日 3:50 PM #69295 返信
    
    名無しさん
    
    でもAWSなら他のサービスとの連携が楽だから、総合的に判断が必要。
- 2025年11月22日 4:00 PM #69296 返信
  
  名無しさん
  
  とりあえず、DeepSeek-V3のローカル実行にこだわるより、こういうクラウド活用もアリだと思うよ。
  - 2025年11月22日 4:02 PM #69297 返信
    
    名無しさん
    
    その通り。用途に応じて使い分けるのがベスト。ただ、コストがネックだから、個人では厳しいかも。
投稿者

投稿

22件の返信を表示中（うち親返信11件）

返信先: DeepSeek-V3をAWSで動かすためのGPUネットワーキング(NCCL+DeepEP+EFA)の話題で#69290に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック