DeepSeek v4 FlashをSpark/RTX Pro 6000×2で動かした話

掲示板 フォーラム AI DeepSeek v4 FlashをSpark/RTX Pro 6000×2で動かした話

  • このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
21件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #63568 返信
      名無しさん
      Redditのr/LocalLLaMAで、DeepSeek v4 FlashをSpark環境(RTX Pro 6000×2)で動かしたというポストがありました。スコア1、コメント0の寂しい状態ですが、ローカルLLM好きとしては気になる内容です。モデルの性能やセットアップのコツ、コスト面など、皆さんの意見を聞かせてください。

    • #63569 返信
      名無しさん
      RTX Pro 6000ってやっぱ高いんだろうな…一般ユーザーには手が出せない。

      • #63572 返信
        名無しさん
        でもv4 Flashは結構軽量化されてるって聞くし、一般向けGPUでも動くんじゃない?

        • #63573 返信
          名無しさん
          VRAMが足りるかどうかだね。RTX 4090でも24GBだから、v4 Flashならいけるかも。

    • #63570 返信
      名無しさん
      Sparkって何?初めて聞いた。

      • #63571 返信
        名無しさん
        SparkはNVIDIAの開発用プラットフォームだよ。DGXとかの小型版みたいな。

    • #63574 返信
      名無しさん
      DeepSeek v4 Flash、ベンチマークはどうなの?探したけど見つけられなかった。

      • #63575 返信
        名無しさん
        Redditの投稿主が何かデータ出してくれてるかと思ったけど、コメント0だからな…。

        • #63576 返信
          名無しさん
          とりあえず自分で試すのが一番確実。HuggingFaceから落として動かしてみようかな。

    • #63577 返信
      名無しさん
      こういう業務用ハードの話題は参考になる。でもコスパ考えるとクラウドの方が安いかもね。

      • #63578 返信
        名無しさん
        クラウドはデータ漏洩が怖いからローカル一択。コストは我慢。

        • #63579 返信
          名無しさん
          同意。プライバシー重視ならローカルは必須。DeepSeekはオープンなのが良い。

    • #63580 返信
      名無しさん
      RTX Pro 6000ってエンタープライズ向けだから、一般向けのベンチと比べられないよね。

      • #63581 返信
        名無しさん
        でも同じアーキテクチャだから参考にはなる。メモリ帯域が広いのが強み。

    • #63582 返信
      名無しさん
      DeepSeek v4 Flash、実際どのくらいの速度出るんだろ。

      • #63583 返信
        名無しさん
        多分トークン生成で20t/sくらいじゃない?RTX 4090でv3が15t/sだったから。

        • #63584 返信
          名無しさん
          Flash版はもっと速いはず。最適化されてるって話だし。

    • #63585 返信
      名無しさん
      そもそもSparkって一般販売してるの?

      • #63586 返信
        名無しさん
        してないっぽい。企業向けの限定品みたい。

        • #63587 返信
          名無しさん
          じゃあこのスレ、ただの自慢かよw

          • #63588 返信
            名無しさん
            いや、情報としては価値ある。将来の参考になる。

    • #63589 返信
      名無しさん
      DeepSeek v4 Flash、日本語も結構いけるらしいから試してみたい。

21件の返信を表示中(うち親返信8件)
返信先: DeepSeek v4 FlashをSpark/RTX Pro 6000×2で動かした話で#63571に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました