DeepSeek V4発表！1TパラメータのMoE、Apache 2.0ライセンスで提供予定

名無しさん · 2025-03-22T05:05:27+09:00

Redditのr/LocalLLaMAで話題になっているDeepSeek V4のアナウンスについてです。総パラメータ1T、アクティブ35BのMoEモデルで、Apache 2.0ライセンスでの公開が約束されています。ベンチマークでは既存モデルを凌ぐ性能が示唆されており、ローカル実行の可能性やコード生成能力に注目が集まっています。

このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。

25件の返信を表示中（うち親返信12件）

投稿者

投稿
- 2025年3月22日 5:05 AM #66947 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで話題になっているDeepSeek V4のアナウンスについてです。総パラメータ1T、アクティブ35BのMoEモデルで、Apache 2.0ライセンスでの公開が約束されています。ベンチマークでは既存モデルを凌ぐ性能が示唆されており、ローカル実行の可能性やコード生成能力に注目が集まっています。
- 2025年3月22日 5:07 AM #66948 返信
  
  名無しさん
  
  ついに来たか！1Tパラメータってすごいな。でもアクティブは35Bならローカルでもなんとかなるのか？
  - 2025年3月22日 5:10 AM #66949 返信
    
    名無しさん
    
    35BアクティブでもVRAM16GBじゃ厳しいと思う。量子化すればいけるかもしれんが。
- 2025年3月22日 5:14 AM #66950 返信
  
  名無しさん
  
  Apache 2.0なのが嬉しい。商用利用も安心だ。
  - 2025年3月22日 5:21 AM #66951 返信
    
    名無しさん
    
    でもライセンスって後で変わることあるからな。約束だけじゃ信用できん。
- 2025年3月22日 5:23 AM #66952 返信
  
  名無しさん
  
  MoEのモデルは推論が速いって聞くけど、実際どうなんだろう。
  - 2025年3月22日 5:26 AM #66953 返信
    
    名無しさん
    
    DeepSeek V2とかも良かったからV4も期待できる。コード生成が得意らしい。
- 2025年3月22日 5:32 AM #66954 返信
  
  名無しさん
  
  1Tパラメータって学習にどれだけ金かかってるんだ…中国の企業は潤沢だな。
  - 2025年3月22日 5:41 AM #66955 返信
    
    名無しさん
    
    でもオープンにしてくれるのはありがたい。研究が進む。
- 2025年3月22日 5:43 AM #66956 返信
  
  名無しさん
  
  ベンチマークの数字だけ見るとClaudeやGPT-4超え？でも過学習の可能性もあるしな。
  - 2025年3月22日 5:45 AM #66957 返信
    
    名無しさん
    
    確かに。実用的なタスクで試さないと分からん。でも競争が激しくなっていいことだ。
- 2025年3月22日 5:49 AM #66958 返信
  
  名無しさん
  
  ローカルで動かすならllama.cpp対応してほしい。今から楽しみ。
  - 2025年3月22日 5:56 AM #66959 返信
    
    名無しさん
    
    多分すぐ対応するだろ。コミュニティが熱いから。
- 2025年3月22日 6:07 AM #66960 返信
  
  名無しさん
  
  でもDeepSeekって中国企業じゃん？データの扱いとか大丈夫か？
  - 2025年3月22日 6:09 AM #66961 返信
    
    名無しさん
    
    オープンならコード見れるから安心。プライバシーは自分で管理すればいい。
    - 2025年3月22日 6:12 AM #66962 返信
      
      名無しさん
      
      とはいえ学習データに何使ってるか分からんし、バイアスは気になる。
- 2025年3月22日 6:17 AM #66963 返信
  
  名無しさん
  
  とりあえずリリースされたらすぐ試すわ。RTX4090で動くかな？
  - 2025年3月22日 6:24 AM #66964 返信
    
    名無しさん
    
    35Bアクティブなら4bit量子化で24GBくらい？4090じゃ厳しいかも。
    - 2025年3月22日 6:27 AM #66965 返信
      
      名無しさん
      
      じゃあ3090でも無理か…マルチGPU必須か。
- 2025年3月22日 6:30 AM #66966 返信
  
  名無しさん
  
  APIで使う分には問題ないな。価格次第だが。
  - 2025年3月22日 6:36 AM #66967 返信
    
    名無しさん
    
    DeepSeekのAPIは安いから期待してる。V4も同じくらいの価格帯なら嬉しい。
- 2025年3月22日 6:46 AM #66968 返信
  
  名無しさん
  
  Apache 2.0なら自分のプロジェクトに組み込みやすい。これは大きい。
- 2025年3月22日 6:47 AM #66969 返信
  
  名無しさん
  
  Redditでは結構盛り上がってたな。でも25コメントしかないのは意外。
  - 2025年3月22日 6:50 AM #66970 返信
    
    名無しさん
    
    話題になるのはこれからだよ。リリースされたら爆発的に伸びる。
- 2025年3月22日 6:54 AM #66971 返信
  
  名無しさん
  
  個人的にはコード生成の性能が気になる。V3でも結構良かったし。
  - 2025年3月22日 7:01 AM #66972 返信
    
    名無しさん
    
    MoEは得意分野に特化したエキスパートがいるから、コード特化のエキスパートがあるといいな。
投稿者

投稿

25件の返信を表示中（うち親返信12件）

返信先: DeepSeek V4発表！1TパラメータのMoE、Apache 2.0ライセンスで提供予定で#66957に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック