- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
26件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「DeepSeek v4-flash vllm error starting up – transformers」という投稿がありました()。vLLMでDeepSeek v4-flashモデルを起動しようとするとエラーが出るという内容。コメントはまだありません。ローカルLLM環境でのトラブルシューティングやDeepSeekモデルの使い方について情報交換しましょう。
-
名無しさん自分も同じエラー出た。CUDAバージョンが合ってないのかも?
-
名無しさんCUDA12.1で動いてるけどダメだった。transformersのバージョン問題かも。
-
-
名無しさんDeepSeek v4-flashってまだ公式サポートされてないんじゃない?
-
名無しさんGitHubのissue見たら、vLLM v0.8.0で一部互換性修正入ったらしい。
-
-
名無しさんこういうエラーはよくある。とりあえず最新版にアップデートしてみて。
-
名無しさんアップデートしたら今度はメモリ不足で落ちた。VRAM足りないのか。
-
-
名無しさんDeepSeek v4はコード生成が優秀って聞くけど、セットアップが大変そう。
-
名無しさん確かに。でも一度動けば便利。自分はAPI使ってる。
-
名無しさんAPIだとコスト気にならない?個人利用ならまあまあだけど。
-
名無しさん用途による。自分はそこまで頻繁に使わないから月数百円で済んでる。
-
-
-
-
名無しさんvLLMの代わりにllama.cppで動かしてる。定番だけど安定してる。
-
名無しさんllama.cppのDeepSeekサポートって最近入ったんだっけ?
-
名無しさんv4-flashはまだかも。自分はv4ベースでやってる。
-
-
-
名無しさんエラーログ見ないと何とも言えないね。具体的にどんなエラー?
-
名無しさん「RuntimeError: Expected all tensors to be on the same device」って出るみたい。
-
名無しさんそれ、モデルのロード中にデバイス指定が一部抜けてるパターン。
-
名無しさんdevice_map=’auto’ を入れたら直ったという報告もある。
-
-
-
-
名無しさん自分はOllamaでDeepSeek使ってる。vLLMより簡単。
-
名無しさんOllamaは量子化モデルしか使えないのがネック。fp16使いたい時はvLLM。
-
名無しさんfp16にこだわる理由が特にないけどね。量子化で十分。
-
-
-
名無しさんDeepSeek v4とv4-flashって何が違うの?
-
名無しさんflashはアテンションメカニズム最適化版。推論速度が少し速いらしい。
-
名無しさんでも互換性に問題があるみたいだね。安定取るなら普通のv4かな。
-
-
-
名無しさん公式ドキュメント読めば書いてあるかも。けど英語多いよね。
-
名無しさんツール使えばなんとかなる。それより情報少ないのがつらい。
-
名無しさんコミュニティ頼りだね。自分も解決したら共有する。
-
-
-
-
投稿者投稿
26件の返信を表示中(うち親返信9件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34