DeepSeek V4のDGX SparkでのFLASH推論パフォーマンスについて

掲示板 フォーラム AI DeepSeek V4のDGX SparkでのFLASH推論パフォーマンスについて

  • このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
22件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #61826 返信
      名無しさん
      Redditのr/LocalLLaMAで話題になっているDeepSeek V4のDGX Spark上でのFLASH推論パフォーマンスに関するスレッドのまとめです。ベンチマーク結果や他のモデルとの比較、ローカルLLM運用のコストやプライバシー面の議論が行われています。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1ttlp99/deepseek_v4_flash_performance_on_dgx_spark/

    • #61827 返信
      名無しさん
      DGX SparkでDeepSeek V4のFLASHが動くって本当?ずっと気になってたんだよね。

      • #61828 返信
        名無しさん
        動くよ。FLASH対応のランタイム使えば結構速いらしい。ただメモリ消費がすごいって話も。

    • #61829 返信
      名無しさん
      ベンチマーク見たけど、V4はコード生成が抜群にいいね。でも日本語はちょっと微妙な気がする。

      • #61830 返信
        名無しさん
        日本語はfine-tune次第じゃない?自分はLlama系の方が相性いいと思う。

        • #61831 返信
          名無しさん
          確かに。でもコスパ考えるとDeepSeekは魅力的。API使えば月額も安いし。

    • #61832 返信
      名無しさん
      DGX Sparkってコンシューマー向けのDGXだっけ?値段が高いって評判だけど、性能は本物なのかな。

      • #61833 返信
        名無しさん
        業務用の割には手が届く価格帯になったよね。でも個人で買うにはまだ勇気いる。

        • #61834 返信
          名無しさん
          レンタルするのが賢いかも。LambdaやVastで似たスペック借りた方が安いし。

    • #61835 返信
      名無しさん
      プライバシー重視ならローカル運用一択だよね。DeepSeek V4のFLASHはデータ漏洩リスク減らせるし。

      • #61836 返信
        名無しさん
        でもモデル自体が中国製なのが気になる人もいるみたい。まあオープンソースだから検証はできるけど。

        • #61837 返信
          名無しさん
          中国政府のバックドアが心配?実際ソースコード見ればわかるし、そこまで paranoid になる必要ないと思う。

    • #61838 返信
      名無しさん
      ベンチマークの数字だけ見るとClaudeやGPT-4oに迫ってるね。特に推論速度で勝ってる部分もある。

      • #61839 返信
        名無しさん
        でも実際に使うと精度はまだ一歩及ばない印象。でも進化のスピードがすごいから追い越すかも。

    • #61840 返信
      名無しさん
      FLASHって量子化版のこと?それとも新しいアーキテクチャ?

      • #61841 返信
        名無しさん
        両方だよ。FP8量子化とFlashAttentionの最適化が入ってるらしい。メモリ効率が劇的に向上してる。

        • #61842 返信
          名無しさん
          なるほど。それならVRAM 48GBくらいでも動くかもね。試してみたい。

    • #61843 返信
      名無しさん
      Redditのスレ見てたらDGX Sparkの価格に見合うかどうか議論してたよ。個人的にはクラウドでいいかな。

      • #61844 返信
        名無しさん
        電源と冷却面でも有利だしな。でもレイテンシ気にするならローカルもあり。

        • #61845 返信
          名無しさん
          レイテンシと言えば、V4の推論速度はNVLinkのおかげで優秀って話だね。

    • #61846 返信
      名無しさん
      コード生成で使ってるけど、最近のアップデートで精度上がった気がする。前より自然なコード吐くようになった。

      • #61847 返信
        名無しさん
        確かに。でも複雑なリファクタリングはまだ任せられないかな。

        • #61848 返信
          名無しさん
          まあ補助的に使う分には十分だよ。自分はVS Codeの拡張で使ってて便利。

22件の返信を表示中(うち親返信8件)
返信先: DeepSeek V4のDGX SparkでのFLASH推論パフォーマンスについてで#61838に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました