DeepSeek V4発表!1TパラメータのMoE、Apache 2.0ライセンスで提供予定

掲示板 フォーラム AI DeepSeek V4発表!1TパラメータのMoE、Apache 2.0ライセンスで提供予定

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
25件の返信を表示中(うち親返信12件)
  • 投稿者
    投稿
    • #66947 返信
      名無しさん
      Redditのr/LocalLLaMAで話題になっているDeepSeek V4のアナウンスについてです。総パラメータ1T、アクティブ35BのMoEモデルで、Apache 2.0ライセンスでの公開が約束されています。ベンチマークでは既存モデルを凌ぐ性能が示唆されており、ローカル実行の可能性やコード生成能力に注目が集まっています。

    • #66948 返信
      名無しさん
      ついに来たか!1Tパラメータってすごいな。でもアクティブは35Bならローカルでもなんとかなるのか?

      • #66949 返信
        名無しさん
        35BアクティブでもVRAM16GBじゃ厳しいと思う。量子化すればいけるかもしれんが。

    • #66950 返信
      名無しさん
      Apache 2.0なのが嬉しい。商用利用も安心だ。

      • #66951 返信
        名無しさん
        でもライセンスって後で変わることあるからな。約束だけじゃ信用できん。

    • #66952 返信
      名無しさん
      MoEのモデルは推論が速いって聞くけど、実際どうなんだろう。

      • #66953 返信
        名無しさん
        DeepSeek V2とかも良かったからV4も期待できる。コード生成が得意らしい。

    • #66954 返信
      名無しさん
      1Tパラメータって学習にどれだけ金かかってるんだ…中国の企業は潤沢だな。

      • #66955 返信
        名無しさん
        でもオープンにしてくれるのはありがたい。研究が進む。

    • #66956 返信
      名無しさん
      ベンチマークの数字だけ見るとClaudeやGPT-4超え?でも過学習の可能性もあるしな。

      • #66957 返信
        名無しさん
        確かに。実用的なタスクで試さないと分からん。でも競争が激しくなっていいことだ。

    • #66958 返信
      名無しさん
      ローカルで動かすならllama.cpp対応してほしい。今から楽しみ。

      • #66959 返信
        名無しさん
        多分すぐ対応するだろ。コミュニティが熱いから。

    • #66960 返信
      名無しさん
      でもDeepSeekって中国企業じゃん?データの扱いとか大丈夫か?

      • #66961 返信
        名無しさん
        オープンならコード見れるから安心。プライバシーは自分で管理すればいい。

        • #66962 返信
          名無しさん
          とはいえ学習データに何使ってるか分からんし、バイアスは気になる。

    • #66963 返信
      名無しさん
      とりあえずリリースされたらすぐ試すわ。RTX4090で動くかな?

      • #66964 返信
        名無しさん
        35Bアクティブなら4bit量子化で24GBくらい?4090じゃ厳しいかも。

        • #66965 返信
          名無しさん
          じゃあ3090でも無理か…マルチGPU必須か。

    • #66966 返信
      名無しさん
      APIで使う分には問題ないな。価格次第だが。

      • #66967 返信
        名無しさん
        DeepSeekのAPIは安いから期待してる。V4も同じくらいの価格帯なら嬉しい。

    • #66968 返信
      名無しさん
      Apache 2.0なら自分のプロジェクトに組み込みやすい。これは大きい。

    • #66969 返信
      名無しさん
      Redditでは結構盛り上がってたな。でも25コメントしかないのは意外。

      • #66970 返信
        名無しさん
        話題になるのはこれからだよ。リリースされたら爆発的に伸びる。

    • #66971 返信
      名無しさん
      個人的にはコード生成の性能が気になる。V3でも結構良かったし。

      • #66972 返信
        名無しさん
        MoEは得意分野に特化したエキスパートがいるから、コード特化のエキスパートがあるといいな。

25件の返信を表示中(うち親返信12件)
返信先: DeepSeek V4発表!1TパラメータのMoE、Apache 2.0ライセンスで提供予定で#66964に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました