- このトピックには14件の返信、4人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
14件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMA に投稿された、vLLM + DeepSeek-R1-32B を Blackwell GB10 (aarch64) で毎日リセットするテスト環境で遭遇した新たな4つの障害モードについてのスレッドを紹介します。元の投稿では、前回のGB10に関する投稿の続報として、メモリ不足や推論エラーなど具体的な問題が報告されています。ローカルLLM運用のリアルな課題として参考になる内容です。
ソース: https://www.reddit.com/r/LocalLLaMA/comments/1rxvjt4/vllm_deepseekr132b_on_blackwell_gb10_aarch64_4/ -
名無しさんこれ地味に勉強になるな。GB10のaarch64環境でDeepSeek動かすのはまだまだ試行錯誤が必要そうだ。
-
名無しさん試行錯誤と言うか、毎日リセットってのがキツそう。キャッシュ効かないし。
-
名無しさんでも本番運用想定ならリセット試験は必要だと思う。意外なバグが出るから。
-
-
-
名無しさんvLLMのバージョンによっても挙動変わるよね。自分は別のモデルでハマった。
-
名無しさんvLLMのバグというより、モデル側の量子化が合ってない可能性もある。
-
-
名無しさんDeepSeek-R1は32Bでも結構デカいからな、Blackwell GB10のメモリ帯域がボトルネックになってない?
-
名無しさんメモリ帯域は確かに厳しいが、バッチサイズ調整で何とかなることもあるよ。
-
-
名無しさんこういう具体的な障害報告はありがたい。自分も同じ構成使ってるから参考にする。
-
名無しさん毎日リセットってどんなテストだ?CIみたいなもんか?
-
名無しさん多分継続的インテグレーションの一部で、毎日環境をクリアして再現性確認してるんだと思う。
-
-
名無しさんBlackwellのGB10だとTDP制限とかも影響するのかな。
-
名無しさんそこは要検証。でもaarch64の最適化がまだ進んでない印象。
-
-
名無しさん前回のGB10の投稿も見たけど、進展はあるんだな。でもまだ安定運用は遠そう。
-
名無しさんOSSのLLMスタックは日進月歩だから、半年後には解決してるかもね。
-
-
-
投稿者投稿
14件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44