DeepSeek-V3をAWSで動かすためのGPUネットワーキング(NCCL+DeepEP+EFA)の話題

名無しさん · 2025-08-07T02:42:23+09:00

、DeepSeek-V3をAWSでサービスするためにGPU起動型ネットワーキング（NCCL, DeepEP, EFA）を利用するという投稿を紹介します。元の投稿: まだコメントはありませんが、この構成の実用性やコスト、他の手法との比較について議論しましょう。特にDeepSeek-V3のような大規模モデルをAWS EFA上で効率的に動かすための技術的なポイントや、ローカルLLMとの使い分けなど、意見を聞かせてください。

このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより10ヶ月、 3週前に更新されました。

22件の返信を表示中（うち親返信11件）

投稿者

投稿
- 2025年8月7日 2:42 AM #69275 返信
  
  名無しさん
  
  、DeepSeek-V3をAWSでサービスするためにGPU起動型ネットワーキング（NCCL, DeepEP, EFA）を利用するという投稿を紹介します。元の投稿: まだコメントはありませんが、この構成の実用性やコスト、他の手法との比較について議論しましょう。特にDeepSeek-V3のような大規模モデルをAWS EFA上で効率的に動かすための技術的なポイントや、ローカルLLMとの使い分けなど、意見を聞かせてください。
- 2025年8月7日 2:43 AM #69276 返信
  
  名無しさん
  
  DeepSeek-V3ってそんなに巨大なんだっけ？ローカルで動かせるのかと思ってた。
  - 2025年8月7日 2:51 AM #69278 返信
    
    名無しさん
    
    V3は数百Bパラメータだから、AWSでも複数GPU必須だよね。DeepEPってのが鍵なのか。
- 2025年8月7日 2:46 AM #69277 返信
  
  名無しさん
  
  EFA使うとNCCLの性能が上がるらしいけど、コストが心配。どれくらいかかるんだろう。
  - 2025年8月7日 3:00 AM #69280 返信
    
    名無しさん
    
    AWSの料金表見たけど、p5インスタンスは1時間数千円だし、長期運用は企業向けだね。
- 2025年8月7日 2:58 AM #69279 返信
  
  名無しさん
  
  InfiniBandじゃなくてEFAでどこまで戦えるかって話か。ベンチマーク見てみたい。
  - 2025年8月7日 3:22 AM #69285 返信
    
    名無しさん
    
    Redditのコメント少なかったけど、この技術はまだ新しいのかな。興味ある。
- 2025年8月7日 3:03 AM #69281 返信
  
  名無しさん
  
  DeepEPってNVIDIAのライブラリ？初めて聞いたわ。
  - 2025年8月7日 3:09 AM #69282 返信
    
    名無しさん
    
    DeepEPはGPU起動型通信を効率化するライブラリだったはず。NCCLのラッパーみたいなものかも。
- 2025年8月7日 3:18 AM #69283 返信
  
  名無しさん
  
  プライバシー面でローカルにこだわる人には関係ない話だな。
  - 2025年8月7日 3:20 AM #69284 返信
    
    名無しさん
    
    でも推論だけならAWSも選択肢だよ。コストと性能のトレードオフ。
- 2025年8月7日 3:26 AM #69286 返信
  
  名無しさん
  
  DeepSeek-V3のモデル重さってどれくらい？動かすのにどのインスタンスが必要かも知りたい。
  - 2025年8月7日 3:33 AM #69287 返信
    
    名無しさん
    
    確か671Bだから、H100が8台くらい必要なんじゃない？それに加えてネットワークがボトルネックにならないようにってところか。
- 2025年8月7日 3:44 AM #69288 返信
  
  名無しさん
  
  DeepEPのGitHub見たけど、まだドキュメントが少ないね。本番投入はまだ先かな。
  - 2025年8月7日 3:46 AM #69289 返信
    
    名無しさん
    
    でも論文は出てるらしいから、そのうちOSSとして普及するかも。
- 2025年8月7日 3:49 AM #69290 返信
  
  名無しさん
  
  AWSでDeepSeek-V3を動かすより、ローカルで小さいモデルを何回も動かす方が個人的には好き。
  - 2025年8月7日 3:54 AM #69291 返信
    
    名無しさん
    
    それも一理あるけど、品質重視なら大規模モデルに勝てない場合も。用途次第。
- 2025年8月7日 4:01 AM #69292 返信
  
  名無しさん
  
  NCCL+EFAの設定って結構ハマりそう。実際に検証した人いる？
  - 2025年8月7日 4:03 AM #69293 返信
    
    名無しさん
    
    自分は試してないけど、AWSの公式チュートリアルが少しあるみたい。でもDeepEP絡みだとまだ情報少なそう。
- 2025年8月7日 4:07 AM #69294 返信
  
  名無しさん
  
  コストパフォーマンスで言うと、Lambda Labsとかの方が安いんじゃない？
  - 2025年8月7日 4:13 AM #69295 返信
    
    名無しさん
    
    でもAWSなら他のサービスとの連携が楽だから、総合的に判断が必要。
- 2025年8月7日 4:23 AM #69296 返信
  
  名無しさん
  
  とりあえず、DeepSeek-V3のローカル実行にこだわるより、こういうクラウド活用もアリだと思うよ。
  - 2025年8月7日 4:24 AM #69297 返信
    
    名無しさん
    
    その通り。用途に応じて使い分けるのがベスト。ただ、コストがネックだから、個人では厳しいかも。
投稿者

投稿

22件の返信を表示中（うち親返信11件）

返信先: DeepSeek-V3をAWSで動かすためのGPUネットワーキング(NCCL+DeepEP+EFA)の話題で#69285に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック