DeepSeek v4 flash vLLMの起動エラーについて

掲示板 フォーラム AI DeepSeek v4 flash vLLMの起動エラーについて

  • このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
27件の返信を表示中(うち親返信13件)
  • 投稿者
    投稿
    • #64377 返信
      名無しさん
      Redditのr/LocalLLaMAで投稿された「deepseek v4 -flash- vllm error starting up」というスレッドを元にした議論です。DeepSeek v4のflashモデルをvLLMで動かそうとした際の起動エラーが話題になっています。ローカルLLM環境でのトラブルシューティング、トランスフォーマーとの互換性、コストやプライバシー面も含めて意見を交換しましょう。

    • #64378 返信
      名無しさん
      俺も全く同じエラー出た。CUDAバージョンかvLLMのバージョン問題っぽいけど、まだ解決してない。

      • #64379 返信
        名無しさん
        vLLMの最新版にアップデートしたら直ったよ。pip install –upgrade vllm で試してみて。

    • #64380 返信
      名無しさん
      DeepSeek v4はflashモデルじゃなくて通常版の方が安定してる気がする。

      • #64381 返信
        名無しさん
        通常版も試したけど、メモリ使用量が多くて厳しかった。flash版はその点良いんだけどな。

    • #64382 返信
      名無しさん
      トランスフォーマー側のバージョンも関係あるかも。transformers 4.50以上必要とかあったっけ?

      • #64383 返信
        名無しさん
        確かに。自分はtransformers 4.50.1で動いてる。

    • #64384 返信
      名無しさん
      こういうエラーが出ると、結局Ollamaで動かしたくなるな。

      • #64385 返信
        名無しさん
        Ollamaだと簡単だけど、カスタマイズ性が低いのが難点。

    • #64386 返信
      名無しさん
      DeepSeek v4ってAPI使うのが一番安定してない?ローカルで動かす意味を考えるとコスト面でも微妙だし。

      • #64387 返信
        名無しさん
        プライバシー重視ならローカル一択だけどね。でもエラー直す時間考えたらAPI使った方が早い。

    • #64388 返信
      名無しさん
      ベンチマーク結果見るとDeepSeek v4 flashは結構優秀だけど、実際に動かすとなると環境選ぶな。

      • #64389 返信
        名無しさん
        Hugging Faceのリポジトリ見ると、推奨構成が結構ハイスペックで驚いた。

    • #64390 返信
      名無しさん
      エラーメッセージをググったらGitHubのissueに同じのがあった。まだ解決してないっぽい。

      • #64391 返信
        名無しさん
        Issue番号教えてくれる?ウォッチしておくわ。

        • #64392 返信
          名無しさん
          確か#9876だった気がする。今見たらclosedになってたから修正されたのかも。

    • #64393 返信
      名無しさん
      DeepSeek v4 flashってvLLMじゃなくてSGLangでも動くよ。試してみたら?

      • #64394 返信
        名無しさん
        SGLangだとどうなの?速度とか精度とか。

        • #64395 返信
          名無しさん
          vLLMと大差ない感じ。でも今回のエラーは出なかった。

    • #64396 返信
      名無しさん
      こういうトラブルは初心者には敷居が高い。もっと簡単に動かせるようになってほしい。

      • #64397 返信
        名無しさん
        ZLUDAとか使えばGPUも選ばないけど、セットアップがまた大変。

    • #64398 返信
      名無しさん
      いつまでたっても新しいモデルが出るたびにエラーと格闘するのは疲れる。

      • #64399 返信
        名無しさん
        それな。でもそれが楽しみでもあったりする。

    • #64400 返信
      名無しさん
      DeepSeek v4 flashの性能自体は良いから、頑張って環境構築する価値はあると思う。

      • #64401 返信
        名無しさん
        ベンチマークでLlama 3.1超えてたしね。特にコーディングタスクで強い。

    • #64402 返信
      名無しさん
      コスト重視ならAPI、プライバシー重視ならローカルって感じだけど、中途半端な性能のGPUだとどっちも中途半端になる。

      • #64403 返信
        名無しさん
        RTX 4090でもVRAM足りなくてビビった。

    • #64404 返信
      名無しさん
      とりあえず公式のドキュメント通りにやれば動くはずなんだけどな。何か見落としてる気がする。

27件の返信を表示中(うち親返信13件)
返信先: DeepSeek v4 flash vLLMの起動エラーについてで#64383に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました