- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 4週前に更新されました。
22件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAで「Running DeepSeek R1 on AMD MI300X」というスレッドが立っていました。DeepSeekモデルをAMDのMI300X(Instinctアクセラレータ)でローカル実行する試みで、コスト、プライバシー、ベンチマーク、コード最適化などが話題になっています。まだコメントはない状態ですが、ローカルLLMコミュニティでは興味深いトピックです。元スレッド: https://www.reddit.com/r/LocalLLaMA/comments/1shsk9j/running_deepseek_r1_on_amd_mi300x/
-
名無しさんMI300XでDeepSeekか…AMDのROCm対応はまだまだ不安定だよね。
-
名無しさん実際に動かした人いたのかな?ベンチマークとか見たい。
-
-
名無しさんローカルLLMはプライバシー面でいいけど、コスト対効果でNVIDIAに勝てるかな。
-
名無しさんMI300Xはメモリ帯域広いから推論向きだと思う。ただしCUDAエコシステムがないのが痛い。
-
名無しさんROCmも最近はマシになったけど、まだドキュメント不足だよね。
-
-
-
名無しさんDeepSeekって中国発のモデルだよね?品質はどうなんだろう。
-
名無しさんベンチマークではLlamaに近いかそれ以上って言われてる。コーディングタスクは強いらしい。
-
名無しさん使ってみたいけど、インストールが面倒そう。Dockerイメージとかあるのかな。
-
-
-
名無しさんAMDでやる意味ってコスト以外にある?NVIDIAより安いとはいえ、導入コストは高いし。
-
名無しさんデータセンターレベルで大量にやるならAMDの方が安いかも。個人用途ならA100とかの方が楽。
-
名無しさんでもAMDはメモリがデカいから、大きいモデルをそのまま載せられるのは利点。
-
-
-
名無しさん実際に動かした人のレビューが出てこないと判断できないな。ソースもコメント0だし。
-
名無しさんRedditのスレッド自体もまだ新しいから、これから情報増えるかもね。
-
-
名無しさんDeepSeekってコード生成は優秀らしいけど、日本語対応はどうなんだろう。
-
名無しさん多分マルチリンガルモデルだから日本語もまあまあ使えるんじゃないかな。試したことないけど。
-
名無しさん英語以外は微妙って話も聞く。日本語特化じゃないとやっぱり精度落ちる。
-
-
-
名無しさんMI300Xって実際どのくらいの速度出るんだろ。GPTQとかAWQみたいな量子化は使えるのかな。
-
名無しさんROCm対応の量子化ライブラリは限られているから、素のFP16で動かすことになりそう。
-
名無しさんそれだとメモリ効率悪いし、速度も出ないかも。やっぱりNVIDIA一択かなあ。
-
-
-
名無しさんローカルで動かすなら、コストより手間がネック。セットアップに数日かかるのは嫌だ。
-
名無しさんそこらへんはコミュニティの知恵で何とかなる部分もある。でも初心者には厳しい。
-
名無しさん結局、時間がある人向けだね。すぐ使いたいならAPI経由が無難。
-
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信8件)
関連するAIトピック
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2026年2月11日 13:57
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44