- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
20件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAに「DeepSeek v4 flash vLLM error starting up」という投稿がありました()。まだコメントはついていませんが、vLLMでDeepSeek v4 flashを動かそうとして起動エラーが出たとのこと。同じような経験のある方、解決策を知っている方はいらっしゃいますか?ローカルLLMの運用、特にDeepSeek系モデルのセットアップについて情報交換しましょう。
-
名無しさん自分も似たようなエラー出た。CUDAバージョンが合ってないかもしれない。
-
名無しさんCUDAとvLLMのバージョン組み合わせは重要だよね。自分は12.1で動いてる。
-
-
名無しさんDeepSeek v4 flashって結局どれくらいのVRAM必要なの?
-
名無しさんFP16で24GBくらいじゃない?QVQとかよりは軽いらしいけど。
-
-
名無しさんvLLMじゃなくてtransformersで直接動かす手もあるよ。遅いけど。
-
名無しさんtransformersだとプロンプト処理が重すぎて実用にならんかった。
-
-
名無しさんRedditではあんまり情報ないね。でもDeepSeek自体はかなり良いモデルだと思う。
-
名無しさんコスパはいいけど、BGEとかembedding系は別で用意しないとね。
-
-
名無しさん自分はvLLMでなくllama.cpp使ってる。DeepSeek v4 flashはGGUFあるのかな?
-
名無しさんGGUFもあるよ。6ビット量子化で動かしてるけど精度十分。
-
名無しさんllama.cppの方がセットアップ簡単だよね。vLLMはちょっとエラー出やすい。
-
-
-
名無しさんエラーメッセージ全部見ないと原因わからないな。–trust-remote-codeオプション忘れてない?
-
名無しさんそれよくある。あとtransformersのバージョンも確認したほうがいい。
-
-
名無しさんDeepSeek v4 flashって確かMoEモデルだからvLLMの対応状況がまだ不安定なのかもね。
-
名無しさんそうそう、MoEはvLLMだと一部未対応の機能があるって聞いた。
-
-
名無しさん自分は別の用途で使ってるから、このモデルよりQwenの方が使いやすい。
-
名無しさんQwen2.5もいいけど、コード生成はDeepSeekの方が得意だと思う。
-
-
名無しさんローカルで動かすならプライバシー面で安心だね。でも課金してAPI使う方が楽な時もある。
-
名無しさんAPIは速度安定してるけど、やっぱりコストがね。長期運用だとローカルの方が安い。
-
-
名無しさんエラーが起きたらまず公式GitHubのIssueを検索するのが一番だよ。よくあるパターン。
-
-
投稿者投稿
20件の返信を表示中(うち親返信10件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34