DeepSeek R1をAMD MI300Xで動かす – ローカルLLM環境の現実

名無しさん · 2025-03-14T06:46:13+09:00

「Running DeepSeek R1 on AMD MI300X」というスレッドが立っていました。DeepSeekモデルをAMDのMI300X（Instinctアクセラレータ）でローカル実行する試みで、コスト、プライバシー、ベンチマーク、コード最適化などが話題になっています。まだコメントはない状態ですが、ローカルLLMコミュニティでは興味深いトピックです。ッド:

このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。

22件の返信を表示中（うち親返信8件）

投稿者

投稿
- 2025年3月14日 6:46 AM #65738 返信
  
  名無しさん
  
  「Running DeepSeek R1 on AMD MI300X」というスレッドが立っていました。DeepSeekモデルをAMDのMI300X（Instinctアクセラレータ）でローカル実行する試みで、コスト、プライバシー、ベンチマーク、コード最適化などが話題になっています。まだコメントはない状態ですが、ローカルLLMコミュニティでは興味深いトピックです。ッド:
- 2025年3月14日 6:47 AM #65739 返信
  
  名無しさん
  
  MI300XでDeepSeekか…AMDのROCm対応はまだまだ不安定だよね。
  - 2025年3月14日 6:50 AM #65740 返信
    
    名無しさん
    
    実際に動かした人いたのかな？ベンチマークとか見たい。
- 2025年3月14日 6:55 AM #65741 返信
  
  名無しさん
  
  ローカルLLMはプライバシー面でいいけど、コスト対効果でNVIDIAに勝てるかな。
  - 2025年3月14日 7:02 AM #65742 返信
    
    名無しさん
    
    MI300Xはメモリ帯域広いから推論向きだと思う。ただしCUDAエコシステムがないのが痛い。
    - 2025年3月14日 7:04 AM #65743 返信
      
      名無しさん
      
      ROCmも最近はマシになったけど、まだドキュメント不足だよね。
- 2025年3月14日 7:07 AM #65744 返信
  
  名無しさん
  
  DeepSeekって中国発のモデルだよね？品質はどうなんだろう。
  - 2025年3月14日 7:13 AM #65745 返信
    
    名無しさん
    
    ベンチマークではLlamaに近いかそれ以上って言われてる。コーディングタスクは強いらしい。
    - 2025年3月14日 7:22 AM #65746 返信
      
      名無しさん
      
      使ってみたいけど、インストールが面倒そう。Dockerイメージとかあるのかな。
- 2025年3月14日 7:24 AM #65747 返信
  
  名無しさん
  
  AMDでやる意味ってコスト以外にある？NVIDIAより安いとはいえ、導入コストは高いし。
  - 2025年3月14日 7:26 AM #65748 返信
    
    名無しさん
    
    データセンターレベルで大量にやるならAMDの方が安いかも。個人用途ならA100とかの方が楽。
    - 2025年3月14日 7:30 AM #65749 返信
      
      名無しさん
      
      でもAMDはメモリがデカいから、大きいモデルをそのまま載せられるのは利点。
- 2025年3月14日 7:37 AM #65750 返信
  
  名無しさん
  
  実際に動かした人のレビューが出てこないと判断できないな。もコメント0だし。
  - 2025年3月14日 7:48 AM #65751 返信
    
    名無しさん
    
    Redditのスレッド自体もまだ新しいから、これから情報増えるかもね。
- 2025年3月14日 7:50 AM #65752 返信
  
  名無しさん
  
  DeepSeekってコード生成は優秀らしいけど、日本語対応はどうなんだろう。
  - 2025年3月14日 7:53 AM #65753 返信
    
    名無しさん
    
    多分マルチリンガルモデルだから日本語もまあまあ使えるんじゃないかな。試したことないけど。
    - 2025年3月14日 7:58 AM #65754 返信
      
      名無しさん
      
      英語以外は微妙って話も聞く。日本語特化じゃないとやっぱり精度落ちる。
- 2025年3月14日 8:05 AM #65755 返信
  
  名無しさん
  
  MI300Xって実際どのくらいの速度出るんだろ。GPTQとかAWQみたいな量子化は使えるのかな。
  - 2025年3月14日 8:07 AM #65756 返信
    
    名無しさん
    
    ROCm対応の量子化ライブラリは限られているから、素のFP16で動かすことになりそう。
    - 2025年3月14日 8:11 AM #65757 返信
      
      名無しさん
      
      それだとメモリ効率悪いし、速度も出ないかも。やっぱりNVIDIA一択かなあ。
- 2025年3月14日 8:17 AM #65758 返信
  
  名無しさん
  
  ローカルで動かすなら、コストより手間がネック。セットアップに数日かかるのは嫌だ。
  - 2025年3月14日 8:27 AM #65759 返信
    
    名無しさん
    
    そこらへんはコミュニティの知恵で何とかなる部分もある。でも初心者には厳しい。
    - 2025年3月14日 8:28 AM #65760 返信
      
      名無しさん
      
      結局、時間がある人向けだね。すぐ使いたいならAPI経由が無難。
投稿者

投稿

22件の返信を表示中（うち親返信8件）

返信先: DeepSeek R1をAMD MI300Xで動かす – ローカルLLM環境の現実で#65748に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック