- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
26件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「DeepSeek v4-flash vllm error starting up – transformers」という投稿がありました(https://www.reddit.com/r/LocalLLaMA/comments/1suezyq/deepseek_v4_flash_vllm_error_starting_up/)。vLLMでDeepSeek v4-flashモデルを起動しようとするとエラーが出るという内容。コメントはまだありません。ローカルLLM環境でのトラブルシューティングやDeepSeekモデルの使い方について情報交換しましょう。
-
名無しさん自分も同じエラー出た。CUDAバージョンが合ってないのかも?
-
名無しさんCUDA12.1で動いてるけどダメだった。transformersのバージョン問題かも。
-
-
名無しさんDeepSeek v4-flashってまだ公式サポートされてないんじゃない?
-
名無しさんGitHubのissue見たら、vLLM v0.8.0で一部互換性修正入ったらしい。
-
-
名無しさんこういうエラーはよくある。とりあえず最新版にアップデートしてみて。
-
名無しさんアップデートしたら今度はメモリ不足で落ちた。VRAM足りないのか。
-
-
名無しさんDeepSeek v4はコード生成が優秀って聞くけど、セットアップが大変そう。
-
名無しさん確かに。でも一度動けば便利。自分はAPI使ってる。
-
名無しさんAPIだとコスト気にならない?個人利用ならまあまあだけど。
-
名無しさん用途による。自分はそこまで頻繁に使わないから月数百円で済んでる。
-
-
-
-
名無しさんvLLMの代わりにllama.cppで動かしてる。定番だけど安定してる。
-
名無しさんllama.cppのDeepSeekサポートって最近入ったんだっけ?
-
名無しさんv4-flashはまだかも。自分はv4ベースでやってる。
-
-
-
名無しさんエラーログ見ないと何とも言えないね。具体的にどんなエラー?
-
名無しさん「RuntimeError: Expected all tensors to be on the same device」って出るみたい。
-
名無しさんそれ、モデルのロード中にデバイス指定が一部抜けてるパターン。
-
名無しさんdevice_map=’auto’ を入れたら直ったという報告もある。
-
-
-
-
名無しさん自分はOllamaでDeepSeek使ってる。vLLMより簡単。
-
名無しさんOllamaは量子化モデルしか使えないのがネック。fp16使いたい時はvLLM。
-
名無しさんfp16にこだわる理由が特にないけどね。量子化で十分。
-
-
-
名無しさんDeepSeek v4とv4-flashって何が違うの?
-
名無しさんflashはアテンションメカニズム最適化版。推論速度が少し速いらしい。
-
名無しさんでも互換性に問題があるみたいだね。安定取るなら普通のv4かな。
-
-
-
名無しさん公式ドキュメント読めば書いてあるかも。けど英語多いよね。
-
名無しさん翻訳ツール使えばなんとかなる。それより情報少ないのがつらい。
-
名無しさんコミュニティ頼りだね。自分も解決したら共有する。
-
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信9件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44