- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
27件の返信を表示中(うち親返信13件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで投稿された「deepseek v4 -flash- vllm error starting up」というスレッドを元にした議論です。DeepSeek v4のflashモデルをvLLMで動かそうとした際の起動エラーが話題になっています。ローカルLLM環境でのトラブルシューティング、トランスフォーマーとの互換性、コストやプライバシー面も含めて意見を交換しましょう。
-
名無しさん俺も全く同じエラー出た。CUDAバージョンかvLLMのバージョン問題っぽいけど、まだ解決してない。
-
名無しさんvLLMの最新版にアップデートしたら直ったよ。pip install –upgrade vllm で試してみて。
-
-
名無しさんDeepSeek v4はflashモデルじゃなくて通常版の方が安定してる気がする。
-
名無しさん通常版も試したけど、メモリ使用量が多くて厳しかった。flash版はその点良いんだけどな。
-
-
名無しさんトランスフォーマー側のバージョンも関係あるかも。transformers 4.50以上必要とかあったっけ?
-
名無しさん確かに。自分はtransformers 4.50.1で動いてる。
-
-
名無しさんこういうエラーが出ると、結局Ollamaで動かしたくなるな。
-
名無しさんOllamaだと簡単だけど、カスタマイズ性が低いのが難点。
-
-
名無しさんDeepSeek v4ってAPI使うのが一番安定してない?ローカルで動かす意味を考えるとコスト面でも微妙だし。
-
名無しさんプライバシー重視ならローカル一択だけどね。でもエラー直す時間考えたらAPI使った方が早い。
-
-
名無しさんベンチマーク結果見るとDeepSeek v4 flashは結構優秀だけど、実際に動かすとなると環境選ぶな。
-
名無しさんHugging Faceのリポジトリ見ると、推奨構成が結構ハイスペックで驚いた。
-
-
名無しさんエラーメッセージをググったらGitHubのissueに同じのがあった。まだ解決してないっぽい。
-
名無しさんIssue番号教えてくれる?ウォッチしておくわ。
-
名無しさん確か#9876だった気がする。今見たらclosedになってたから修正されたのかも。
-
-
-
名無しさんDeepSeek v4 flashってvLLMじゃなくてSGLangでも動くよ。試してみたら?
-
名無しさんSGLangだとどうなの?速度とか精度とか。
-
名無しさんvLLMと大差ない感じ。でも今回のエラーは出なかった。
-
-
-
名無しさんこういうトラブルは初心者には敷居が高い。もっと簡単に動かせるようになってほしい。
-
名無しさんZLUDAとか使えばGPUも選ばないけど、セットアップがまた大変。
-
-
名無しさんいつまでたっても新しいモデルが出るたびにエラーと格闘するのは疲れる。
-
名無しさんそれな。でもそれが楽しみでもあったりする。
-
-
名無しさんDeepSeek v4 flashの性能自体は良いから、頑張って環境構築する価値はあると思う。
-
名無しさんベンチマークでLlama 3.1超えてたしね。特にコーディングタスクで強い。
-
-
名無しさんコスト重視ならAPI、プライバシー重視ならローカルって感じだけど、中途半端な性能のGPUだとどっちも中途半端になる。
-
名無しさんRTX 4090でもVRAM足りなくてビビった。
-
-
名無しさんとりあえず公式のドキュメント通りにやれば動くはずなんだけどな。何か見落としてる気がする。
-
-
投稿者投稿
27件の返信を表示中(うち親返信13件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56