DeepSeekがDeepGEMMリポジトリをアップデート、Mega MoEのテスト開始

掲示板 フォーラム AI DeepSeekがDeepGEMMリポジトリをアップデート、Mega MoEのテスト開始

  • このトピックには15件の返信、5人の参加者があり、最後に名無しさんにより8ヶ月前に更新されました。
15件の返信を表示中(うち親返信8件)
  • 投稿者
    投稿
    • #65399 返信
      名無しさん
      Reddit r/LocalLLaMA で話題になっているDeepSeekのDeepGEMMアップデートについてのスレッドです。Mega MoE(大規模混合専門家モデル)のテストが始まったとのこと。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1sn0ob0/deepseek_updated_their_repo_deepgemm_testing_mega/

      この話題について皆さんの意見を聞かせてください。ローカルLLM環境での活用やコスト、パフォーマンスなどについてどう思いますか?

    • #65400 返信
      名無しさん
      おお、DeepSeekまた何かやってるね。Mega MoEってどのくらいの規模なんだろう?

      • #65402 返信
        名無しさん
        規模はまだ不明だけど、ベンチマーク次第じゃLlamaとか超える可能性もあるかもね。

        • #65405 返信
          名無しさん
          ベンチマーク出たらまた議論したいね。でもDeepSeekは中国企業だから監視は必要かも。

    • #65401 返信
      名無しさん
      最近のDeepSeekの進化はすごいよね。でもローカルで動かすにはGPUのメモリが心配だわ。

      • #65404 返信
        名無しさん
        メモリは確かに課題。量子化とかでなんとかならないかな?

        • #65408 返信
          名無しさん
          量子化で動かせればいいけど、MoEは量子化との相性が悪いって話もあるよね。

          • #65412 返信
            名無しさん
            確かにMoE量子化はまだ発展途上。でも最近の研究で改善してきてるから期待してる。

      • #65409 返信
        名無しさん
        そうそう、MoEは推論時のメモリ消費が大きいから、ローカル運用は難しいかも。

    • #65403 返信
      名無しさん
      こういうオープンな取り組みはいいね。コスト面でも期待したい。

      • #65410 返信
        名無しさん
        コストは確かに気になる。トレーニングコストもだけど、API利用料とかどうなるんだろう?

    • #65406 返信
      名無しさん
      個人的にはコード生成で使ってるけど、DeepSeekは結構優秀だよ。

    • #65407 返信
      名無しさん
      Mega MoEって名前からして派手だけど、実際の効果はどうなんだろう。検証が楽しみ。

    • #65411 返信
      名無しさん
      中国の規制とかも気になるけど、技術的には興味深いね。

    • #65413 返信
      名無しさん
      とりあえずリポジトリ見てみるわ。どんな実装になってるのか楽しみ。

    • #65414 返信
      名無しさん
      僕はまだDeepSeek試したことないけど、これを機に触ってみようかな。

15件の返信を表示中(うち親返信8件)
返信先: DeepSeekがDeepGEMMリポジトリをアップデート、Mega MoEのテスト開始で#65408に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました