DeepSeek V4-Flashを8x H100で動かしたらmHCがすごいらしい

名無しさん · 2025-10-15T13:56:37+09:00

Reddit r/LocalLLaMAで「8x H100でDeepSeek V4-Flashの内部を動かしてみた – mHCが実際にやっていること」という投稿がありました。モデルの内部動作やmHCの効果について議論されています。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1syeqpe/i_ran_deepseek_v4flash_internals_on_8x_h100s/

このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。

25件の返信を表示中（うち親返信9件）

投稿者

投稿
- 2025年10月15日 1:56 PM #63474 返信
  
  名無しさん
  
  Reddit r/LocalLLaMAで「8x H100でDeepSeek V4-Flashの内部を動かしてみた – mHCが実際にやっていること」という投稿がありました。モデルの内部動作やmHCの効果について議論されています。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1syeqpe/i_ran_deepseek_v4flash_internals_on_8x_h100s/
- 2025年10月15日 1:58 PM #63475 返信
  
  名無しさん
  
  mHCって何の略？初めて聞いた。
  - 2025年10月15日 2:05 PM #63477 返信
    
    名無しさん
    
    なるほど、KVキャッシュの改良版って感じか。
- 2025年10月15日 2:01 PM #63476 返信
  
  名無しさん
  
  Multi-Head Cacheのことらしい。推論高速化の仕組みみたい。
- 2025年10月15日 2:12 PM #63478 返信
  
  名無しさん
  
  8台のH100って金持ちすぎるだろ。個人では無理。
  - 2025年10月15日 2:14 PM #63479 返信
    
    名無しさん
    
    クラウドでレンタルすれば意外と安く済むらしいよ。
    - 2025年10月15日 2:18 PM #63480 返信
      
      名無しさん
      
      それでも1時間数千円はかかるんでしょ？気軽にはできないな。
- 2025年10月15日 2:24 PM #63481 返信
  
  名無しさん
  
  DeepSeek V4ってどのくらいの性能なんだ？他のモデルと比較して。
  - 2025年10月15日 2:33 PM #63482 返信
    
    名無しさん
    
    ベンチマークではLlama 3.1 405Bに迫るって噂。でも実際は使ってみないと分からない。
- 2025年10月15日 2:34 PM #63483 返信
  
  名無しさん
  
  mHCの効果って本当にあるの？過大評価されてない？
  - 2025年10月15日 2:36 PM #63484 返信
    
    名無しさん
    
    自分のテストだとトークン生成速度が20%くらい上がった。ただし精度に影響はない。
    - 2025年10月15日 2:40 PM #63485 返信
      
      名無しさん
      
      それは結構な改善だな。でもキャッシュのメモリ使用量は増えるんでしょ？
      - 2025年10月15日 2:47 PM #63486 返信
        
        名無しさん
        
        そこがトレードオフ。H100なら余裕かもしれんが、コンシューマー向けGPUだと厳しいかも。
- 2025年10月15日 2:58 PM #63487 返信
  
  名無しさん
  
  DeepSeekって中国の企業だよね。データプライバシー大丈夫？
  - 2025年10月15日 3:00 PM #63488 返信
    
    名無しさん
    
    ローカルで動かすから問題ない。むしろAPI使うほうがリスク。
    - 2025年10月15日 3:03 PM #63489 返信
      
      名無しさん
      
      そうか。でもモデル自体にバックドアがあったら怖いな。
      - 2025年10月15日 3:08 PM #63490 返信
        
        名無しさん
        
        オープンウェイトだから検証できるし、コミュニティでチェックされてるよ。
- 2025年10月15日 3:15 PM #63491 返信
  
  名無しさん
  
  8x H100なんて環境、普通の人は持てないから、もっと軽いモデルに期待。
  - 2025年10月15日 3:18 PM #63492 返信
    
    名無しさん
    
    V4-Flashは蒸留モデルだから、8x H100は過剰かも。実際は4台でも動くらしい。
    - 2025年10月15日 3:21 PM #63493 返信
      
      名無しさん
      
      情報ありがとう。じゃあ2台のA100でもなんとか？
      - 2025年10月15日 3:27 PM #63494 返信
        
        名無しさん
        
        メモリ次第。V4-Flashは700Bパラメータあるから、2台のA100 80GBでは足りないかも。
- 2025年10月15日 3:37 PM #63495 返信
  
  名無しさん
  
  このスレ、技術的に深いな。もっと詳細なドキュメント欲しい。
  - 2025年10月15日 3:39 PM #63496 返信
    
    名無しさん
    
    Redditの元スレにもっと詳しく書いてあるよ。興味あるなら読んでみて。
    - 2025年10月15日 3:41 PM #63497 返信
      
      名無しさん
      
      見てきたけど、結構専門的だった。でもmHCの実装は参考になる。
- 2025年10月15日 3:46 PM #63498 返信
  
  名無しさん
  
  結局、コスパはどうなの？GPT-4よりも安く済む？
  - 2025年10月15日 3:52 PM #63499 返信
    
    名無しさん
    
    自前で動かせば長期的には安いけど、初期投資とメンテが大変。APIのほうが手軽。
投稿者

投稿

25件の返信を表示中（うち親返信9件）

返信先: DeepSeek V4-Flashを8x H100で動かしたらmHCがすごいらしい

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック