DeepSeek V4-Flashを8x H100で動かしたらmHCがすごいらしい

名無しさん · 2025-02-27T10:35:06+09:00

「8x H100でDeepSeek V4-Flashの内部を動かしてみた – mHCが実際にやっていること」という投稿がありました。モデルの内部動作やmHCの効果について議論されています。

このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。

25件の返信を表示中（うち親返信9件）

投稿者

投稿
- 2025年2月27日 10:35 AM #63474 返信
  
  名無しさん
  
  「8x H100でDeepSeek V4-Flashの内部を動かしてみた – mHCが実際にやっていること」という投稿がありました。モデルの内部動作やmHCの効果について議論されています。
- 2025年2月27日 10:36 AM #63475 返信
  
  名無しさん
  
  mHCって何の略？初めて聞いた。
  - 2025年2月27日 10:44 AM #63477 返信
    
    名無しさん
    
    なるほど、KVキャッシュの改良版って感じか。
- 2025年2月27日 10:39 AM #63476 返信
  
  名無しさん
  
  Multi-Head Cacheのことらしい。推論高速化の仕組みみたい。
- 2025年2月27日 10:51 AM #63478 返信
  
  名無しさん
  
  8台のH100って金持ちすぎるだろ。個人では無理。
  - 2025年2月27日 10:53 AM #63479 返信
    
    名無しさん
    
    クラウドでレンタルすれば意外と安く済むらしいよ。
    - 2025年2月27日 10:56 AM #63480 返信
      
      名無しさん
      
      それでも1時間数千円はかかるんでしょ？気軽にはできないな。
- 2025年2月27日 11:02 AM #63481 返信
  
  名無しさん
  
  DeepSeek V4ってどのくらいの性能なんだ？他のモデルと比較して。
  - 2025年2月27日 11:11 AM #63482 返信
    
    名無しさん
    
    ベンチマークではLlama 3.1 405Bに迫るって噂。でも実際は使ってみないと分からない。
- 2025年2月27日 11:12 AM #63483 返信
  
  名無しさん
  
  mHCの効果って本当にあるの？過大評価されてない？
  - 2025年2月27日 11:15 AM #63484 返信
    
    名無しさん
    
    自分のテストだとトークン生成速度が20%くらい上がった。ただし精度に影響はない。
    - 2025年2月27日 11:19 AM #63485 返信
      
      名無しさん
      
      それは結構な改善だな。でもキャッシュのメモリ使用量は増えるんでしょ？
      - 2025年2月27日 11:25 AM #63486 返信
        
        名無しさん
        
        そこがトレードオフ。H100なら余裕かもしれんが、コンシューマー向けGPUだと厳しいかも。
- 2025年2月27日 11:37 AM #63487 返信
  
  名無しさん
  
  DeepSeekって中国の企業だよね。データプライバシー大丈夫？
  - 2025年2月27日 11:39 AM #63488 返信
    
    名無しさん
    
    ローカルで動かすから問題ない。むしろAPI使うほうがリスク。
    - 2025年2月27日 11:42 AM #63489 返信
      
      名無しさん
      
      そうか。でもモデル自体にバックドアがあったら怖いな。
      - 2025年2月27日 11:46 AM #63490 返信
        
        名無しさん
        
        オープンウェイトだから検証できるし、コミュニティでチェックされてるよ。
- 2025年2月27日 11:54 AM #63491 返信
  
  名無しさん
  
  8x H100なんて環境、普通の人は持てないから、もっと軽いモデルに期待。
  - 2025年2月27日 11:56 AM #63492 返信
    
    名無しさん
    
    V4-Flashは蒸留モデルだから、8x H100は過剰かも。実際は4台でも動くらしい。
    - 2025年2月27日 12:00 PM #63493 返信
      
      名無しさん
      
      情報ありがとう。じゃあ2台のA100でもなんとか？
      - 2025年2月27日 12:05 PM #63494 返信
        
        名無しさん
        
        メモリ次第。V4-Flashは700Bパラメータあるから、2台のA100 80GBでは足りないかも。
- 2025年2月27日 12:15 PM #63495 返信
  
  名無しさん
  
  このスレ、技術的に深いな。もっと詳細なドキュメント欲しい。
  - 2025年2月27日 12:17 PM #63496 返信
    
    名無しさん
    
    Redditのもっと詳しく書いてあるよ。興味あるなら読んでみて。
    - 2025年2月27日 12:20 PM #63497 返信
      
      名無しさん
      
      見てきたけど、結構専門的だった。でもmHCの実装は参考になる。
- 2025年2月27日 12:24 PM #63498 返信
  
  名無しさん
  
  結局、コスパはどうなの？GPT-4よりも安く済む？
  - 2025年2月27日 12:31 PM #63499 返信
    
    名無しさん
    
    自前で動かせば長期的には安いけど、初期投資とメンテが大変。APIのほうが手軽。
投稿者

投稿

25件の返信を表示中（うち親返信9件）

返信先: DeepSeek V4-Flashを8x H100で動かしたらmHCがすごいらしいで#63488に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック