Deepseek V4 Flash・Non-Flash が HuggingFace に登場!ローカルLLMの新時代?

掲示板 フォーラム AI Deepseek V4 Flash・Non-Flash が HuggingFace に登場!ローカルLLMの新時代?

  • このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
16件の返信を表示中(うち親返信12件)
  • 投稿者
    投稿
    • #65953 返信
      名無しさん
      話題になっている Deepseek V4 の Flash 版と Non-Flash 版が HuggingFace に公開されたようです。スコア778、コメント312件の盛り上がりで、コーディング性能やコスト、プライバシー、ベンチマーク比較などが議論されています。: このスレでは、ローカルLLMユーザーとしての感想や疑問を自由に交換しましょう。

    • #65954 返信
      名無しさん
      ついに来たか!V4はコード生成がめちゃくちゃ良いって聞いてたから楽しみ。

    • #65955 返信
      名無しさん
      Flash版とNon-Flash版の違いって何?推論速度以外に何かあるの?

    • #65956 返信
      名無しさん
      また誇大広告じゃない?V3の時も最初は騒がれてたけど実際は期待はずれだったし。

    • #65957 返信
      名無しさん
      でもライセンスはMITらしいし、商用利用もOKでしょ?そこは評価できる。

    • #65958 返信
      名無しさん
      RTX 3090で動かしてみたけど、Flash版は量子化なしでもまあまあ速い。18BパラメータだからVRAM12GBくらいで行ける。

    • #65959 返信
      名無しさん
      Qwen2.5 32Bと比べてどうなん?コーディングならDeepseekの方が上って聞くけど。

    • #65960 返信
      名無しさん
      Flash版ってvLLMとかで使う用?それとも普通にOllamaでも動く?

      • #65961 返信
        名無しさん
        Flash版は推論最適化されてるから、vLLM向けかもしれないけど、Ollamaでもgguf化すれば使えるよ。Non-Flashの方が変換しやすいかも。

        • #65962 返信
          名無しさん
          なるほど、とりあえずNon-Flashを試してみるわ。ありがとう。

    • #65963 返信
      名無しさん
      実際にコード書かせてみたけど、Pythonのリファクタリングはかなり正確。ただし日本語のコメントはちょっと怪しいかも。

    • #65964 返信
      名無しさん
      API使うならDeepseekの公式が安いけど、ローカルで動かすと電気代が…。でもプライバシー面ではローカルに勝るものなし。

      • #65965 返信
        名無しさん
        確かに。機密コード扱うならローカル一択だよね。コストはトレードオフだけど。

    • #65966 返信
      名無しさん
      オープンLLMの進化が速すぎる。半年後には何が出てるんだろうな。

    • #65967 返信
      名無しさん
      ベンチマーク見た?HumanEvalとMBPPでかなり高いスコア出してるけど、実用的なタスクでの性能はどうなんだろう?

      • #65968 返信
        名無しさん
        ベンチマークは参考程度でいいと思う。実際にプロジェクトで使ってみないとわかんないな。ただ、コミュニティの反応を見てると期待できそう。

    • #65969 返信
      名無しさん
      とりあえずダウンロードして試す価値はあるね。みんなの感想聞けて助かった。

16件の返信を表示中(うち親返信12件)
返信先: Deepseek V4 Flash・Non-Flash が HuggingFace に登場!ローカルLLMの新時代?で#65963に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました