DeepSeek R1をAMD MI300Xで動かす試みとその感想

名無しさん · 2025-11-06T16:46:43+09:00

Redditのr/LocalLLaMAで「DeepSeek R1をAMD MI300Xで動かす」というスレッドが立っていました。元の投稿は403で直接見られませんが、タイトルやスニペットから、DeepSeekモデルのローカル実行、コーディング、コスト、プライバシー、ベンチマークなどが話題になっているようです。MI300XはAMDの強力なGPUですが、CUDAではなくROCmでの動作がカギ。実際に動かした人の感想や、パフォーマンス、他のGPUとの比較など、情報を共有しましょう。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1shc8bl/running_deepseek_r1_on_amd_mi300x/

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。

27件の返信を表示中（うち親返信10件）

投稿者

投稿
- 2025年11月6日 4:46 PM #66870 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで「DeepSeek R1をAMD MI300Xで動かす」というスレッドが立っていました。元の投稿は403で直接見られませんが、タイトルやスニペットから、DeepSeekモデルのローカル実行、コーディング、コスト、プライバシー、ベンチマークなどが話題になっているようです。MI300XはAMDの強力なGPUですが、CUDAではなくROCmでの動作がカギ。実際に動かした人の感想や、パフォーマンス、他のGPUとの比較など、情報を共有しましょう。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1shc8bl/running_deepseek_r1_on_amd_mi300x/
- 2025年11月6日 4:48 PM #66871 返信
  
  名無しさん
  
  MI300XでDeepSeek R1動かすの結構大変そうだね。ROCmのセットアップがネックになりそう。
  - 2025年11月6日 4:51 PM #66872 返信
    
    名無しさん
    
    確かに。でもNVidia一強状態より選択肢が増えるのは良いこと。実際に動いたって報告はあるの？
    - 2025年11月6日 4:55 PM #66873 返信
      
      名無しさん
      
      Redditでも数人成功してるみたい。ただしカスタムビルドが必要で、公式サポート外らしい。
- 2025年11月6日 5:02 PM #66874 返信
  
  名無しさん
  
  DeepSeek R1の性能自体はすごいけど、ローカルで動かすとなるとVRAMが足りるかが問題。MI300Xは192GBあるから余裕？
  - 2025年11月6日 5:04 PM #66875 返信
    
    名無しさん
    
    理論上は余裕だけど、実際のメモリバンド幅や最適化次第。H100より遅いって話もある。
    - 2025年11月6日 5:08 PM #66876 返信
      
      名無しさん
      
      遅くても使えればいい派。コスト考えるとMI300Xの方が手が出しやすいし。
- 2025年11月6日 5:14 PM #66877 返信
  
  名無しさん
  
  ROCmの互換性がまだ微妙。PyTorchのバージョン選びとか面倒くさい。
  - 2025年11月6日 5:23 PM #66878 返信
    
    名無しさん
    
    でも最近のROCm 6.0は結構改善されてるって聞く。試してみる価値はあるかも。
    - 2025年11月6日 5:24 PM #66879 返信
      
      名無しさん
      
      改善されてるけど、それでもNVIDIAのCUDAエコシステムには敵わない。でもAMD頑張ってほしい。
- 2025年11月6日 5:27 PM #66880 返信
  
  名無しさん
  
  DeepSeekって中国製だからセキュリティ面で心配って意見もあるけど、ローカルで動かせば問題ないんじゃない？
  - 2025年11月6日 5:31 PM #66881 返信
    
    名無しさん
    
    モデル自体は公開されてるし、ファインチューニングで独自データ使うなら気にしなくていいと思う。でもバイアスは注意。
    - 2025年11月6日 5:37 PM #66882 返信
      
      名無しさん
      
      そうそう。R1はコーディング向けらしいから、コード生成に特化してる。実際使ってみたけど結構使える。
- 2025年11月6日 5:49 PM #66883 返信
  
  名無しさん
  
  ベンチマーク結果見ると、DeepSeek R1はLlama 3.1 70Bと同等かそれ以上って言われてるね。
  - 2025年11月6日 5:50 PM #66884 返信
    
    名無しさん
    
    ただしMMLUとかの日本語性能は未知数。日本語データであまり学習してなさそう。
    - 2025年11月6日 5:53 PM #66885 返信
      
      名無しさん
      
      日本語はLlamaベースの方がまだ安心かも。DeepSeekも今後マルチリンガル対応するだろうけど。
- 2025年11月6日 5:58 PM #66886 返信
  
  名無しさん
  
  MI300Xの消費電力も気になる。H100よりは抑えられてるらしいけど、それでも大きい。
  - 2025年11月6日 6:06 PM #66887 返信
    
    名無しさん
    
    自宅で動かすには電気代がね…。クラウドでレンタルする方が現実的かも。
    - 2025年11月6日 6:08 PM #66888 返信
      
      名無しさん
      
      クラウドだと今のところMI300Xを提供してるところ少ないんだよな。AWSやGCPはまだ未対応。
- 2025年11月6日 6:12 PM #66889 返信
  
  名無しさん
  
  そもそもDeepSeek R1自体がまだ発展途上。アップデートで劇的に変わる可能性ある。
  - 2025年11月6日 6:17 PM #66890 返信
    
    名無しさん
    
    そういう意味では今すぐ買うより様子見もあり。でも個人で試す分には安いGPUで十分。
- 2025年11月6日 6:27 PM #66891 返信
  
  名無しさん
  
  結局、CUDAに依存し続けるのはリスク。AMDのような選択肢が増えるのは業界にとって良い。
  - 2025年11月6日 6:29 PM #66892 返信
    
    名無しさん
    
    賛成。でもROCmのドキュメンテーションがもっと充実しないと普及は難しい。
    - 2025年11月6日 6:31 PM #66893 返信
      
      名無しさん
      
      コミュニティの力でなんとかなってる感はある。Reddit見てると結構情報あるよ。
- 2025年11月6日 6:36 PM #66894 返信
  
  名無しさん
  
  MI300XでDeepSeek動かせた人は量子化とか使ってるのかな？それともFP16そのまま？
  - 2025年11月6日 6:42 PM #66895 返信
    
    名無しさん
    
    多分量子化してると思う。192GBあればFP16でも動くけど、速度重視なら量子化でしょう。
- 2025年11月6日 6:54 PM #66896 返信
  
  名無しさん
  
  DeepSeek R1のライセンスって商用利用OKだっけ？確認したほうがいいよ。
  - 2025年11月6日 6:56 PM #66897 返信
    
    名無しさん
    
    確かMITライセンスだったはず。商用OKだけど、派生モデルは開示義務があるとか？詳細は公式を確認。
投稿者

投稿

27件の返信を表示中（うち親返信10件）

返信先: DeepSeek R1をAMD MI300Xで動かす試みとその感想で#66873に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック