DeepSeek 128kコンテキストでメモリ使用量125MB？それとも8〜9GB？混乱してる

このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。

21件の返信を表示中（うち親返信11件）

投稿者

投稿
- 2025年11月3日 12:50 PM #66438 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeekの128kコンテキスト時のメモリ使用量について混乱している投稿がありました。投稿者によると、作者が「128kで125MB未満」と主張しているのに、他のソースやBF16の計算式からは128kで8〜9GBのVRAMが必要になるとのこと。実際のところはどうなんでしょうか？ローカルLLMの実運用におけるメモリ効率や、DeepSeekの最適化の真偽について議論しましょう。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s6qdva/im_confused_here_the_author_says_at_128k_context/
- 2025年11月3日 12:51 PM #66439 返信
  
  名無しさん
  
  125MBってありえなくない？何か特別な量子化とかキャッシュの工夫をしてるのかな。
  - 2025年11月3日 12:59 PM #66441 返信
    
    名無しさん
    
    それでも125MBは極端すぎる。KVキャッシュだけでそれくらい行くと思う。
    - 2025年11月3日 1:08 PM #66443 返信
      
      名無しさん
      
      そうそう。128kのKVキャッシュはBF16でモデルサイズと同じくらいになるはず。
- 2025年11月3日 12:54 PM #66440 返信
  
  名無しさん
  
  BF16だと確かに8GB超えるはず。でも、DeepSeekが独自の圧縮技術を使ってる可能性はある。
  - 2025年11月3日 1:28 PM #66447 返信
    
    名無しさん
    
    それでも125MBは無理だよ。例えばMHAの代わりにMQAとか使うにしても圧縮率が桁違い。
    - 2025年11月3日 1:52 PM #66451 返信
      
      名無しさん
      
      MQAでも128kはきつい。もしかしてコンテキストウィンドウを小さく分割して処理してるとか？
- 2025年11月3日 1:06 PM #66442 返信
  
  名無しさん
  
  実際に動かしてみた人のレポートが欲しい。
  - 2025年11月3日 1:17 PM #66445 返信
    
    名無しさん
    
    Redditのコメントでも議論になってたけど、検証結果が出てないんだよね。
    - 2025年11月3日 1:34 PM #66449 返信
      
      名無しさん
      
      HuggingFaceのベンチマークとか見てもそんな数字は出てこないね。
- 2025年11月3日 1:11 PM #66444 返信
  
  名無しさん
  
  多分なんか勘違いしてるんじゃない？モデルパラメータ数とコンテキストを混同してるとか。
- 2025年11月3日 1:26 PM #66446 返信
  
  名無しさん
  
  DeepSeekは効率重視で設計されてるから、何かしら賢い方法を使ってるのかも。
- 2025年11月3日 1:30 PM #66448 返信
  
  名無しさん
  
  マーケティングの誇大広告かもしれない。実際に使うとVRAM不足で落ちるとか。
- 2025年11月3日 1:41 PM #66450 返信
  
  名無しさん
  
  仕組みが知りたい。CPUオフロードとか併用してるの？
  - 2025年11月3日 1:57 PM #66453 返信
    
    名無しさん
    
    GPUだけでやるならどう考えても無理。CPU+GPUのハイブリッドならあり得るかも。
- 2025年11月3日 1:54 PM #66452 返信
  
  名無しさん
  
  とにかく公式のベンチマークを出してほしい。ローカルLLMユーザーとしては重要だから。
  - 2025年11月3日 2:09 PM #66455 返信
    
    名無しさん
    
    同意。ソースコード読めばわかることもあるけど、やっぱり実測が大事。
- 2025年11月3日 2:02 PM #66454 返信
  
  名無しさん
  
  この手の話はよくあるけど、実際に試すまでわからない。自分は試してみる価値はあると思う。
- 2025年11月3日 2:11 PM #66456 返信
  
  名無しさん
  
  モデル自体のサイズが小さければ、その分コンテキストに回せるから、意外と現実的なのかも？
  - 2025年11月3日 2:15 PM #66457 返信
    
    名無しさん
    
    でもDeepSeekって結構大きいモデルじゃなかった？パラメータ数が多ければコンテキストも食う。
- 2025年11月3日 2:21 PM #66458 返信
  
  名無しさん
  
  そもそも125MBって数字がどこから来たのか調べたほうがいい。引用元の文脈が違うのかも。
  - 2025年11月3日 2:31 PM #66459 返信
    
    名無しさん
    
    そういう意味では、このスレッドで出てる情報だけでは判断できないね。もっとソースを確認しよう。
投稿者

投稿

21件の返信を表示中（うち親返信11件）

返信先: DeepSeek 128kコンテキストでメモリ使用量125MB？それとも8〜9GB？混乱してるで#66442に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック