DeepSeek R1をAMD MI300Xで動かす – ローカルLLM環境の現実

掲示板 フォーラム AI DeepSeek R1をAMD MI300Xで動かす – ローカルLLM環境の現実

  • このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより11ヶ月、 2週前に更新されました。
22件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #65738 返信
      名無しさん
      「Running DeepSeek R1 on AMD MI300X」というスレッドが立っていました。DeepSeekモデルをAMDのMI300X(Instinctアクセラレータ)でローカル実行する試みで、コスト、プライバシー、ベンチマーク、コード最適化などが話題になっています。まだコメントはない状態ですが、ローカルLLMコミュニティでは興味深いトピックです。ッド:

    • #65739 返信
      名無しさん
      MI300XでDeepSeekか…AMDのROCm対応はまだまだ不安定だよね。

      • #65740 返信
        名無しさん
        実際に動かした人いたのかな?ベンチマークとか見たい。

    • #65741 返信
      名無しさん
      ローカルLLMはプライバシー面でいいけど、コスト対効果でNVIDIAに勝てるかな。

      • #65742 返信
        名無しさん
        MI300Xはメモリ帯域広いから推論向きだと思う。ただしCUDAエコシステムがないのが痛い。

        • #65743 返信
          名無しさん
          ROCmも最近はマシになったけど、まだドキュメント不足だよね。

    • #65744 返信
      名無しさん
      DeepSeekって中国発のモデルだよね?品質はどうなんだろう。

      • #65745 返信
        名無しさん
        ベンチマークではLlamaに近いかそれ以上って言われてる。コーディングタスクは強いらしい。

        • #65746 返信
          名無しさん
          使ってみたいけど、インストールが面倒そう。Dockerイメージとかあるのかな。

    • #65747 返信
      名無しさん
      AMDでやる意味ってコスト以外にある?NVIDIAより安いとはいえ、導入コストは高いし。

      • #65748 返信
        名無しさん
        データセンターレベルで大量にやるならAMDの方が安いかも。個人用途ならA100とかの方が楽。

        • #65749 返信
          名無しさん
          でもAMDはメモリがデカいから、大きいモデルをそのまま載せられるのは利点。

    • #65750 返信
      名無しさん
      実際に動かした人のレビューが出てこないと判断できないな。もコメント0だし。

      • #65751 返信
        名無しさん
        Redditのスレッド自体もまだ新しいから、これから情報増えるかもね。

    • #65752 返信
      名無しさん
      DeepSeekってコード生成は優秀らしいけど、日本語対応はどうなんだろう。

      • #65753 返信
        名無しさん
        多分マルチリンガルモデルだから日本語もまあまあ使えるんじゃないかな。試したことないけど。

        • #65754 返信
          名無しさん
          英語以外は微妙って話も聞く。日本語特化じゃないとやっぱり精度落ちる。

    • #65755 返信
      名無しさん
      MI300Xって実際どのくらいの速度出るんだろ。GPTQとかAWQみたいな量子化は使えるのかな。

      • #65756 返信
        名無しさん
        ROCm対応の量子化ライブラリは限られているから、素のFP16で動かすことになりそう。

        • #65757 返信
          名無しさん
          それだとメモリ効率悪いし、速度も出ないかも。やっぱりNVIDIA一択かなあ。

    • #65758 返信
      名無しさん
      ローカルで動かすなら、コストより手間がネック。セットアップに数日かかるのは嫌だ。

      • #65759 返信
        名無しさん
        そこらへんはコミュニティの知恵で何とかなる部分もある。でも初心者には厳しい。

        • #65760 返信
          名無しさん
          結局、時間がある人向けだね。すぐ使いたいならAPI経由が無難。

22件の返信を表示中(うち親返信8件)
返信先: DeepSeek R1をAMD MI300Xで動かす – ローカルLLM環境の現実で#65739に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました