- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより11ヶ月、 2週前に更新されました。
20件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAに「DeepSeek v4 flash vLLM error starting up」という投稿がありました()。まだコメントはついていませんが、vLLMでDeepSeek v4 flashを動かそうとして起動エラーが出たとのこと。同じような経験のある方、解決策を知っている方はいらっしゃいますか?ローカルLLMの運用、特にDeepSeek系モデルのセットアップについて情報交換しましょう。
-
名無しさん自分も似たようなエラー出た。CUDAバージョンが合ってないかもしれない。
-
名無しさんCUDAとvLLMのバージョン組み合わせは重要だよね。自分は12.1で動いてる。
-
-
名無しさんDeepSeek v4 flashって結局どれくらいのVRAM必要なの?
-
名無しさんFP16で24GBくらいじゃない?QVQとかよりは軽いらしいけど。
-
-
名無しさんvLLMじゃなくてtransformersで直接動かす手もあるよ。遅いけど。
-
名無しさんtransformersだとプロンプト処理が重すぎて実用にならんかった。
-
-
名無しさんRedditではあんまり情報ないね。でもDeepSeek自体はかなり良いモデルだと思う。
-
名無しさんコスパはいいけど、BGEとかembedding系は別で用意しないとね。
-
-
名無しさん自分はvLLMでなくllama.cpp使ってる。DeepSeek v4 flashはGGUFあるのかな?
-
名無しさんGGUFもあるよ。6ビット量子化で動かしてるけど精度十分。
-
名無しさんllama.cppの方がセットアップ簡単だよね。vLLMはちょっとエラー出やすい。
-
-
-
名無しさんエラーメッセージ全部見ないと原因わからないな。–trust-remote-codeオプション忘れてない?
-
名無しさんそれよくある。あとtransformersのバージョンも確認したほうがいい。
-
-
名無しさんDeepSeek v4 flashって確かMoEモデルだからvLLMの対応状況がまだ不安定なのかもね。
-
名無しさんそうそう、MoEはvLLMだと一部未対応の機能があるって聞いた。
-
-
名無しさん自分は別の用途で使ってるから、このモデルよりQwenの方が使いやすい。
-
名無しさんQwen2.5もいいけど、コード生成はDeepSeekの方が得意だと思う。
-
-
名無しさんローカルで動かすならプライバシー面で安心だね。でも課金してAPI使う方が楽な時もある。
-
名無しさんAPIは速度安定してるけど、やっぱりコストがね。長期運用だとローカルの方が安い。
-
-
名無しさんエラーが起きたらまず公式GitHubのIssueを検索するのが一番だよ。よくあるパターン。
-
-
投稿者投稿
20件の返信を表示中(うち親返信10件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01