- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
27件の返信を表示中(うち親返信13件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで投稿された「deepseek v4 -flash- vllm error starting up」というスレッドを元にした議論です。DeepSeek v4のflashモデルをvLLMで動かそうとした際の起動エラーが話題になっています。ローカルLLM環境でのトラブルシューティング、トランスフォーマーとの互換性、コストやプライバシー面も含めて意見を交換しましょう。
-
名無しさん俺も全く同じエラー出た。CUDAバージョンかvLLMのバージョン問題っぽいけど、まだ解決してない。
-
名無しさんvLLMの最新版にアップデートしたら直ったよ。pip install –upgrade vllm で試してみて。
-
-
名無しさんDeepSeek v4はflashモデルじゃなくて通常版の方が安定してる気がする。
-
名無しさん通常版も試したけど、メモリ使用量が多くて厳しかった。flash版はその点良いんだけどな。
-
-
名無しさんトランスフォーマー側のバージョンも関係あるかも。transformers 4.50以上必要とかあったっけ?
-
名無しさん確かに。自分はtransformers 4.50.1で動いてる。
-
-
名無しさんこういうエラーが出ると、結局Ollamaで動かしたくなるな。
-
名無しさんOllamaだと簡単だけど、カスタマイズ性が低いのが難点。
-
-
名無しさんDeepSeek v4ってAPI使うのが一番安定してない?ローカルで動かす意味を考えるとコスト面でも微妙だし。
-
名無しさんプライバシー重視ならローカル一択だけどね。でもエラー直す時間考えたらAPI使った方が早い。
-
-
名無しさんベンチマーク結果見るとDeepSeek v4 flashは結構優秀だけど、実際に動かすとなると環境選ぶな。
-
名無しさんHugging Faceのリポジトリ見ると、推奨構成が結構ハイスペックで驚いた。
-
-
名無しさんエラーメッセージをググったらGitHubのissueに同じのがあった。まだ解決してないっぽい。
-
名無しさんIssue番号教えてくれる?ウォッチしておくわ。
-
名無しさん確か#9876だった気がする。今見たらclosedになってたから修正されたのかも。
-
-
-
名無しさんDeepSeek v4 flashってvLLMじゃなくてSGLangでも動くよ。試してみたら?
-
名無しさんSGLangだとどうなの?速度とか精度とか。
-
名無しさんvLLMと大差ない感じ。でも今回のエラーは出なかった。
-
-
-
名無しさんこういうトラブルは初心者には敷居が高い。もっと簡単に動かせるようになってほしい。
-
名無しさんZLUDAとか使えばGPUも選ばないけど、セットアップがまた大変。
-
-
名無しさんいつまでたっても新しいモデルが出るたびにエラーと格闘するのは疲れる。
-
名無しさんそれな。でもそれが楽しみでもあったりする。
-
-
名無しさんDeepSeek v4 flashの性能自体は良いから、頑張って環境構築する価値はあると思う。
-
名無しさんベンチマークでLlama 3.1超えてたしね。特にコーディングタスクで強い。
-
-
名無しさんコスト重視ならAPI、プライバシー重視ならローカルって感じだけど、中途半端な性能のGPUだとどっちも中途半端になる。
-
名無しさんRTX 4090でもVRAM足りなくてビビった。
-
-
名無しさんとりあえず公式のドキュメント通りにやれば動くはずなんだけどな。何か見落としてる気がする。
-
-
投稿者投稿
27件の返信を表示中(うち親返信13件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34