- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより11ヶ月、 3週前に更新されました。
13件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek v4 flashモデルをvLLMで立ち上げようとした際のエラー報告が投稿されていました。トランスフォーマー周りの問題のようです。ローカルLLM環境でのモデル読み込みや依存関係のトラブルはよくありますね。皆さんはどのように対処していますか?
-
名無しさんvLLMのバージョン問題じゃない?最新にしたら直ったとか。
-
名無しさん自分も同じエラー出たけど、 transformers を4.48.0にダウングレードしたら動いたよ。
-
名無しさんなるほど、バージョン管理が大事なんだな。自分はDockerで環境分けてる。
-
-
名無しさんそこそこメモリ食うし、GPU数枚ないと厳しい。
-
-
名無しさんDeepSeek v4 flashってまだベータっぽいし、ドキュメント少ないからつらい。
-
名無しさんエラーメッセージ詳細がほしい。たぶんCUDA関連も絡んでる。
-
名無しさんそうそう、とりあえず–dtype auto つけると回避できることもある。
-
-
名無しさん自分はvLLMよりllama.cpp派。軽いしトラブル少ない。
-
名無しさんでもvLLMの方が推論速度出るから、場面によるよね。
-
-
名無しさんDeepSeek自体はコスパ良いと思うけど、環境構築がハードル。
-
名無しさんマジで。公式の手順通りやっても動かんときある。フォーラムで助け合うしか。
-
-
名無しさんプライバシー面でローカルLLMは重要だけど、こういうバグに時間取られるのが辛い。
-
名無しさんまあでもOSSコミュニティがすぐ直すから、気長にやろうぜ。
-
-
-
投稿者投稿
13件の返信を表示中(うち親返信6件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01