DeepSeek v4 flashをvllmで動かす相談スレ

掲示板 フォーラム AI DeepSeek v4 flashをvllmで動かす相談スレ

  • このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
21件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #63868 返信
      名無しさん
      Redditのr/LocalLLaMAで「Check this beauty out / need help on vllm Deepseek v4 flash」というスレッドが立っていました。DeepSeek v4のflash attentionをvLLMで動作させる際の課題や、ローカルLLMの運用コスト、プライバシー面のメリットなどが話題になっています。はコメントが少ないですが、ここで議論を広げましょう。

    • #63869 返信
      名無しさん
      DeepSeek v4 flashってやっぱりメモリ使用量が少ないんだよね?試してみたいけどvLLMの設定が難しそう。

    • #63870 返信
      名無しさん
      自分もvLLMでDeepSeek v4 flashを動かそうとしてエラーが出た。キャッシュの設定が原因かもしれない。

      • #63871 返信
        名無しさん
        キャッシュはflash attnのバージョン依存らしいよ。vLLMの最新版にアップデートしたら直った。

        • #63872 返信
          名無しさん
          なるほど。自分は素直にHugging Faceのtransformersで動かしてる。速度はvLLMより落ちるけど安定してる。

    • #63873 返信
      名無しさん
      このモデル、ベンチマークでは結構良いスコア出てるよね。ローカルで使うならコスパ良さそう。

      • #63874 返信
        名無しさん
        でもDeepSeekって中国企業だし、データ収集が気になる。プライバシー重視ならローカル運用が必須だね。

        • #63875 返信
          名無しさん
          ローカルならデータ漏洩の心配は減るけど、モデル自体にバイアスがある可能性は否めない。

      • #63876 返信
        名無しさん
        実際のコーディングタスクで使ってみたけど、普通に使えるレベル。ただし日本語の精度はまだ微妙。

        • #63877 返信
          名無しさん
          日本語はどうしてもLLaMA系の方が上だよね。DeepSeekは英語特化っぽい。

    • #63878 返信
      名無しさん
      vLLMの設定で詰まってる人、–enforce-eagerオプション試してみて。メモリ使用量は増えるけど動くよ。

      • #63879 返信
        名無しさん
        そのオプション知らなかった。今度試してみる。ありがとう。

    • #63880 返信
      名無しさん
      Flash attentionって結局どれくらい速いの?体感できるレベル?

      • #63881 返信
        名無しさん
        長いコンテキストだと明らかに速いよ。特に8Kトークン超えると差が分かる。

    • #63882 返信
      名無しさん
      DeepSeek v4 flashってAPIもあるけど、ローカルで動かす方がコスト安いよね?でも電気代考えると微妙かも。

      • #63883 返信
        名無しさん
        APIは従量課金で短い会話なら安いけど、頻繁に使うならローカルの方が結果的に安いと思う。

    • #63884 返信
      名無しさん
      このスレ見て自分もインストールしてみた。vLLMのドキュメント通りにやれば一発で動いたよ。

      • #63885 返信
        名無しさん
        ラッキーだね。自分はCUDAのバージョンでハマった。やっぱり環境によるんだろうな。

    • #63886 返信
      名無しさん
      DeepSeekシリーズはどんどん進化してるね。次のv5が楽しみ。

      • #63887 返信
        名無しさん
        v5って噂あるの?情報源教えてほしい。

        • #63888 返信
          名無しさん
          GitHubのリポジトリでissueに書かれてた気がする。ただ正式発表じゃないから信ぴょう性は微妙。

    • #63889 返信
      名無しさん
      とりあえず動かす方法が分かったから、いろんなタスクで試してみる。英語のコード生成はかなり優秀だよ。

21件の返信を表示中(うち親返信9件)
返信先: DeepSeek v4 flashをvllmで動かす相談スレで#63877に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました