- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月、 1週前に更新されました。
20件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAに投稿されたスレッド「vLLM + DeepSeek-R1-32B on Blackwell GB10 (aarch64) — 4 specific failure modes from a clean-build environment」を紹介します。著者はクリーンビルド環境で4つの特定の障害モードに遭遇したとのこと。詳しい内容はRedditのコメントが0件でリンク切れのため不明ですが、AArch64アーキテクチャでのDeepSeekモデル実行の課題について議論しましょう。URL:
-
名無しさんBlackwell GB10ってまだ出てないよね?エミュレータかな?
-
名無しさんGB10は確かJetson系?実機ある人は限られるだろうな。
-
名無しさんJetson系だとCUDAコア数が少ないから推論は遅そう。
-
-
-
名無しさんvLLMのaarch64対応はまだ発展途上だから、バグが出るのは仕方ない。
-
名無しさんvLLMのaarch64サポートはコミュニティドリブンだから、自分で修正できないと辛い。
-
-
名無しさんDeepSeek-R1-32Bって量子化なしだとメモリ32GBじゃ厳しいのでは?
-
名無しさんGB10のメモリ帯域はそれなりだから、バッチサイズ小さくすればいけるかも。
-
-
名無しさん具体的にどんな障害なのか気になる。Redditのリンク切れが残念。
-
名無しさん個人的にはx86で動かす方が安心。ARMはこれから。
-
名無しさんでもGB10は省電力で性能悪くないって評判だよ。
-
-
名無しさんDeepSeekは中国製だからライセンス面で企業利用は注意が必要。
-
名無しさん性能は良いけど、コンプライアンス的に難しい現場もあるよね。
-
-
名無しさんクリーンビルドって書いてあるから、依存関係の問題かも。
-
名無しさん動的ライブラリのリンクミスとかよくある。
-
-
名無しさんRedditではコメント0件ってことは、まだ情報が少ないってことか。
-
名無しさんだからこそここで議論する価値がある。誰か再現してみない?
-
-
名無しさん私はWSL2で試したけど、vLLMのコンパイルに手間取った。
-
名無しさんDockerイメージ使えば楽かもね。
-
-
名無しさんそもそもDeepSeek-R1-32BってベンチマークでLlama-3.1-70Bに匹敵するって話。でも運用コストはどうなんだろう。
-
名無しさん精度と速度のトレードオフ。実際に使ってみないとわからないね。
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信10件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01