DeepSeek v4-flash vLLM起動エラーについて

掲示板 フォーラム AI DeepSeek v4-flash vLLM起動エラーについて

  • このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
26件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #64324 返信
      名無しさん
      Redditのr/LocalLLaMAで「DeepSeek v4-flash vllm error starting up – transformers」という投稿がありました(https://www.reddit.com/r/LocalLLaMA/comments/1suezyq/deepseek_v4_flash_vllm_error_starting_up/)。vLLMでDeepSeek v4-flashモデルを起動しようとするとエラーが出るという内容。コメントはまだありません。ローカルLLM環境でのトラブルシューティングやDeepSeekモデルの使い方について情報交換しましょう。

    • #64325 返信
      名無しさん
      自分も同じエラー出た。CUDAバージョンが合ってないのかも?

      • #64326 返信
        名無しさん
        CUDA12.1で動いてるけどダメだった。transformersのバージョン問題かも。

    • #64327 返信
      名無しさん
      DeepSeek v4-flashってまだ公式サポートされてないんじゃない?

      • #64328 返信
        名無しさん
        GitHubのissue見たら、vLLM v0.8.0で一部互換性修正入ったらしい。

    • #64329 返信
      名無しさん
      こういうエラーはよくある。とりあえず最新版にアップデートしてみて。

      • #64330 返信
        名無しさん
        アップデートしたら今度はメモリ不足で落ちた。VRAM足りないのか。

    • #64331 返信
      名無しさん
      DeepSeek v4はコード生成が優秀って聞くけど、セットアップが大変そう。

      • #64332 返信
        名無しさん
        確かに。でも一度動けば便利。自分はAPI使ってる。

        • #64333 返信
          名無しさん
          APIだとコスト気にならない?個人利用ならまあまあだけど。

          • #64334 返信
            名無しさん
            用途による。自分はそこまで頻繁に使わないから月数百円で済んでる。

    • #64335 返信
      名無しさん
      vLLMの代わりにllama.cppで動かしてる。定番だけど安定してる。

      • #64336 返信
        名無しさん
        llama.cppのDeepSeekサポートって最近入ったんだっけ?

        • #64337 返信
          名無しさん
          v4-flashはまだかも。自分はv4ベースでやってる。

    • #64338 返信
      名無しさん
      エラーログ見ないと何とも言えないね。具体的にどんなエラー?

      • #64339 返信
        名無しさん
        「RuntimeError: Expected all tensors to be on the same device」って出るみたい。

        • #64340 返信
          名無しさん
          それ、モデルのロード中にデバイス指定が一部抜けてるパターン。

          • #64341 返信
            名無しさん
            device_map=’auto’ を入れたら直ったという報告もある。

    • #64342 返信
      名無しさん
      自分はOllamaでDeepSeek使ってる。vLLMより簡単。

      • #64343 返信
        名無しさん
        Ollamaは量子化モデルしか使えないのがネック。fp16使いたい時はvLLM。

        • #64344 返信
          名無しさん
          fp16にこだわる理由が特にないけどね。量子化で十分。

    • #64345 返信
      名無しさん
      DeepSeek v4とv4-flashって何が違うの?

      • #64346 返信
        名無しさん
        flashはアテンションメカニズム最適化版。推論速度が少し速いらしい。

        • #64347 返信
          名無しさん
          でも互換性に問題があるみたいだね。安定取るなら普通のv4かな。

    • #64348 返信
      名無しさん
      公式ドキュメント読めば書いてあるかも。けど英語多いよね。

      • #64349 返信
        名無しさん
        翻訳ツール使えばなんとかなる。それより情報少ないのがつらい。

        • #64350 返信
          名無しさん
          コミュニティ頼りだね。自分も解決したら共有する。

26件の返信を表示中(うち親返信9件)
返信先: DeepSeek v4-flash vLLM起動エラーについてで#64348に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました