DeepSeek新モデル、コンテキスト長3.2M？1Mじゃないらしい

このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月前に更新されました。

26件の返信を表示中（うち親返信13件）

投稿者

投稿
- 2025年11月23日 12:49 AM #69361 返信
  
  名無しさん
  
  話題のDeepSeek新モデル、当初1Mコンテキストと言われていたけど実は3.2Mかもしれないという投稿がありました。
  ローカルLLMユーザーとしてはコンテキスト長の拡大は嬉しいけど、メモリ消費や速度が気になりますね。皆さんはどう思いますか？
- 2025年11月23日 12:50 AM #69362 返信
  
  名無しさん
  
  3.2Mってすごいな。でもローカルだとGPUメモリが足りなさそう。
  - 2025年11月23日 12:58 AM #69364 返信
    
    名無しさん
    
    今の4090でも24GBじゃ厳しいだろうね。量子化すればいけるか？
- 2025年11月23日 12:53 AM #69363 返信
  
  名無しさん
  
  本当ならコード補完に使いたい。長いプロジェクト全体を入れられるかも。
- 2025年11月23日 1:05 AM #69365 返信
  
  名無しさん
  
  DeepSeekは中国のモデルだから、やっぱりデータ収集が気になる。
  - 2025年11月23日 1:07 AM #69366 返信
    
    名無しさん
    
    ローカルで動かせば問題ないでしょ。オープンだし。
- 2025年11月23日 1:10 AM #69367 返信
  
  名無しさん
  
  Redditではベンチマーク結果が賛否両論だったな。実際の性能はどうなんだろう。
  - 2025年11月23日 1:16 AM #69368 返信
    
    名無しさん
    
    リーダーボードでは上位だけど、実用的なタスクだと微妙って声もあるよ。
- 2025年11月23日 1:25 AM #69369 返信
  
  名無しさん
  
  コンテキスト長だけじゃなくて、推論コストも下がってるといいな。
  - 2025年11月23日 1:26 AM #69370 返信
    
    名無しさん
    
    確かに。APIの価格次第では業務でも使える。
- 2025年11月23日 1:29 AM #69371 返信
  
  名無しさん
  
  3.2Mって検索拡張(RAG)いらなくなるレベルじゃない？
  - 2025年11月23日 1:33 AM #69372 返信
    
    名無しさん
    
    いや、それでも検索は必要だよ。全部の情報をコンテキストに入れるのは非効率。
- 2025年11月23日 1:39 AM #69373 返信
  
  名無しさん
  
  これってDeepSeek-V3の後継？それとも別物？
  - 2025年11月23日 1:51 AM #69374 返信
    
    名無しさん
    
    おそらくR1系統の派生モデルじゃないかな。詳細まだ不明。
- 2025年11月23日 1:53 AM #69375 返信
  
  名無しさん
  
  とにかくベンチマークの数字だけじゃなくて、自分の使い方で試したい。
  - 2025年11月23日 1:56 AM #69376 返信
    
    名無しさん
    
    Ollamaで早く動かせるようにならないかな。
- 2025年11月23日 2:00 AM #69377 返信
  
  名無しさん
  
  contextの長さだけで優劣決めるのは危険。精度が落ちるかもしれない。
  - 2025年11月23日 2:08 AM #69378 返信
    
    名無しさん
    
    その通り。長ければいいってもんじゃない。Lost in the middle問題は解決されてるの？
    - 2025年11月23日 2:10 AM #69379 返信
      
      名無しさん
      
      そこが一番気になる。論文ではどうなってるんだろう。
- 2025年11月23日 2:14 AM #69380 返信
  
  名無しさん
  
  中国の規制に引っかからなければいいけど。
  - 2025年11月23日 2:19 AM #69381 返信
    
    名無しさん
    
    オープンだからこそ、自分でチェックできる。
- 2025年11月23日 2:29 AM #69382 返信
  
  名無しさん
  
  しかし3.2Mって聞くと、Llama 3.1 405Bの128Kが小さく感じるな。
  - 2025年11月23日 2:31 AM #69383 返信
    
    名無しさん
    
    でも405Bはパラメータ数が桁違い。コンテキスト長だけ比較してもね。
- 2025年11月23日 2:34 AM #69384 返信
  
  名無しさん
  
  個人的には1Mでも十分すぎる。3.2Mって誰が使うんだ？
  - 2025年11月23日 2:38 AM #69385 返信
    
    名無しさん
    
    コード生成や法律文書分析には役立つかも。
- 2025年11月23日 2:45 AM #69386 返信
  
  名無しさん
  
  とにかく実際にリリースされてから評価しよう。今は噂段階だし。
  - 2025年11月23日 2:57 AM #69387 返信
    
    名無しさん
    
    楽しみだけど、過度な期待は禁物だね。
投稿者

投稿

26件の返信を表示中（うち親返信13件）

返信先: DeepSeek新モデル、コンテキスト長3.2M？1Mじゃないらしい

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

関連するAIトピック