DeepSeek V4-Flashを8x H100で動かしたらmHCがすごいらしい

掲示板 フォーラム AI DeepSeek V4-Flashを8x H100で動かしたらmHCがすごいらしい

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
25件の返信を表示中(うち親返信9件)
  • 投稿者
    投稿
    • #63474 返信
      名無しさん
      「8x H100でDeepSeek V4-Flashの内部を動かしてみた – mHCが実際にやっていること」という投稿がありました。モデルの内部動作やmHCの効果について議論されています。

    • #63475 返信
      名無しさん
      mHCって何の略?初めて聞いた。

      • #63477 返信
        名無しさん
        なるほど、KVキャッシュの改良版って感じか。

    • #63476 返信
      名無しさん
      Multi-Head Cacheのことらしい。推論高速化の仕組みみたい。

    • #63478 返信
      名無しさん
      8台のH100って金持ちすぎるだろ。個人では無理。

      • #63479 返信
        名無しさん
        クラウドでレンタルすれば意外と安く済むらしいよ。

        • #63480 返信
          名無しさん
          それでも1時間数千円はかかるんでしょ?気軽にはできないな。

    • #63481 返信
      名無しさん
      DeepSeek V4ってどのくらいの性能なんだ?他のモデルと比較して。

      • #63482 返信
        名無しさん
        ベンチマークではLlama 3.1 405Bに迫るって噂。でも実際は使ってみないと分からない。

    • #63483 返信
      名無しさん
      mHCの効果って本当にあるの?過大評価されてない?

      • #63484 返信
        名無しさん
        自分のテストだとトークン生成速度が20%くらい上がった。ただし精度に影響はない。

        • #63485 返信
          名無しさん
          それは結構な改善だな。でもキャッシュのメモリ使用量は増えるんでしょ?

          • #63486 返信
            名無しさん
            そこがトレードオフ。H100なら余裕かもしれんが、コンシューマー向けGPUだと厳しいかも。

    • #63487 返信
      名無しさん
      DeepSeekって中国の企業だよね。データプライバシー大丈夫?

      • #63488 返信
        名無しさん
        ローカルで動かすから問題ない。むしろAPI使うほうがリスク。

        • #63489 返信
          名無しさん
          そうか。でもモデル自体にバックドアがあったら怖いな。

          • #63490 返信
            名無しさん
            オープンウェイトだから検証できるし、コミュニティでチェックされてるよ。

    • #63491 返信
      名無しさん
      8x H100なんて環境、普通の人は持てないから、もっと軽いモデルに期待。

      • #63492 返信
        名無しさん
        V4-Flashは蒸留モデルだから、8x H100は過剰かも。実際は4台でも動くらしい。

        • #63493 返信
          名無しさん
          情報ありがとう。じゃあ2台のA100でもなんとか?

          • #63494 返信
            名無しさん
            メモリ次第。V4-Flashは700Bパラメータあるから、2台のA100 80GBでは足りないかも。

    • #63495 返信
      名無しさん
      このスレ、技術的に深いな。もっと詳細なドキュメント欲しい。

      • #63496 返信
        名無しさん
        Redditのもっと詳しく書いてあるよ。興味あるなら読んでみて。

        • #63497 返信
          名無しさん
          見てきたけど、結構専門的だった。でもmHCの実装は参考になる。

    • #63498 返信
      名無しさん
      結局、コスパはどうなの?GPT-4よりも安く済む?

      • #63499 返信
        名無しさん
        自前で動かせば長期的には安いけど、初期投資とメンテが大変。APIのほうが手軽。

25件の返信を表示中(うち親返信9件)
返信先: DeepSeek V4-Flashを8x H100で動かしたらmHCがすごいらしいで#63497に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました