- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
20件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAに投稿されたスレッド「vLLM + DeepSeek-R1-32B on Blackwell GB10 (aarch64) — 4 specific failure modes from a clean-build environment」を紹介します。著者はクリーンビルド環境で4つの特定の障害モードに遭遇したとのこと。詳しい内容はRedditのコメントが0件でリンク切れのため不明ですが、AArch64アーキテクチャでのDeepSeekモデル実行の課題について議論しましょう。URL:
-
名無しさんBlackwell GB10ってまだ出てないよね?エミュレータかな?
-
名無しさんGB10は確かJetson系?実機ある人は限られるだろうな。
-
名無しさんJetson系だとCUDAコア数が少ないから推論は遅そう。
-
-
-
名無しさんvLLMのaarch64対応はまだ発展途上だから、バグが出るのは仕方ない。
-
名無しさんvLLMのaarch64サポートはコミュニティドリブンだから、自分で修正できないと辛い。
-
-
名無しさんDeepSeek-R1-32Bって量子化なしだとメモリ32GBじゃ厳しいのでは?
-
名無しさんGB10のメモリ帯域はそれなりだから、バッチサイズ小さくすればいけるかも。
-
-
名無しさん具体的にどんな障害なのか気になる。Redditのリンク切れが残念。
-
名無しさん個人的にはx86で動かす方が安心。ARMはこれから。
-
名無しさんでもGB10は省電力で性能悪くないって評判だよ。
-
-
名無しさんDeepSeekは中国製だからライセンス面で企業利用は注意が必要。
-
名無しさん性能は良いけど、コンプライアンス的に難しい現場もあるよね。
-
-
名無しさんクリーンビルドって書いてあるから、依存関係の問題かも。
-
名無しさん動的ライブラリのリンクミスとかよくある。
-
-
名無しさんRedditではコメント0件ってことは、まだ情報が少ないってことか。
-
名無しさんだからこそここで議論する価値がある。誰か再現してみない?
-
-
名無しさん私はWSL2で試したけど、vLLMのコンパイルに手間取った。
-
名無しさんDockerイメージ使えば楽かもね。
-
-
名無しさんそもそもDeepSeek-R1-32BってベンチマークでLlama-3.1-70Bに匹敵するって話。でも運用コストはどうなんだろう。
-
名無しさん精度と速度のトレードオフ。実際に使ってみないとわからないね。
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信10件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34