DeepSeekやMoonshot AIが来年には数兆パラメータのオープンウェイトモデルをリリースする可能性について

このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 1ヶ月前に更新されました。

13件の返信を表示中（うち親返信7件）

投稿者

投稿
- 2025年5月1日 12:30 PM #73189 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで話題になっているスレッドです。DeepSeekやMoonshot AIといった企業が、来年には数兆パラメータ級のオープンウェイトモデルを出すかもしれないとの予測について議論されています。新しいアーキテクチャが開発されなければ、こうした巨大モデルが登場する可能性が高いとのこと。日本でもローカルLLMとして使えるか、コストやプライバシー面での懸念など、様々な意見があります。ッド:
- 2025年5月1日 12:32 PM #73190 返信
  
  名無しさん
  
  数兆パラメータって、もう人間の脳みそのシナプス数超えてるんじゃないか？そんなモデルをローカルで動かすのは無理だろ。
  - 2025年5月1日 12:35 PM #73191 返信
    
    名無しさん
    
    量子化とか蒸留技術で小さくできるかもしれないけど、それでもRAMが何TBも必要になりそうだな。
  - 2025年5月1日 12:39 PM #73192 返信
    
    名無しさん
    
    それでもオープンウェイトならクラウドで使う分にはいいかもね。ただしAPI料金が高そう。
- 2025年5月1日 12:46 PM #73193 返信
  
  名無しさん
  
  DeepSeekって中国企業だよね？プライバシー的に大丈夫なのかな。
  - 2025年5月1日 12:48 PM #73194 返信
    
    名無しさん
    
    オープンウェイトなら自分で検証できるから、プライバシーはある程度コントロールできると思う。でも学習データに中国の検閲が入ってる可能性はある。
- 2025年5月1日 12:52 PM #73195 返信
  
  名無しさん
  
  そもそもそんな巨大モデルって本当に必要なん？現状の70Bとかでも十分賢いし。
  - 2025年5月1日 12:58 PM #73196 返信
    
    名無しさん
    
    専門的なタスクやマルチモーダルになるとまだまだ改良の余地はあるよ。でもコスト対効果が問題。
- 2025年5月1日 1:07 PM #73197 返信
  
  名無しさん
  
  ベンチマークでどのくらい伸びるんだろうね。MMLUとかHumanEvalで劇的な差が出るなら価値あるかも。
  - 2025年5月1日 1:08 PM #73198 返信
    
    名無しさん
    
    前にDeepSeekのモデルがコーディングで結構いいスコア出してたから、さらに上がったら凄いな。
- 2025年5月1日 1:11 PM #73199 返信
  
  名無しさん
  
  Moonshot AIってあまり聞かないけど、どんなとこ？
  - 2025年5月1日 1:15 PM #73200 返信
    
    名無しさん
    
    中国のスタートアップで、Kimiという長文対応のモデルで有名。資金調達もしてるらしい。
- 2025年5月1日 1:21 PM #73201 返信
  
  名無しさん
  
  とにかく注目だわ。来年はLLM業界がまた大きく動きそう。
- 2025年5月1日 1:33 PM #73202 返信
  
  名無しさん
  
  でもアメリカの規制とかで中国からのオープンウェイトが制限される可能性もあるから、その辺も気になる。
投稿者

投稿

13件の返信を表示中（うち親返信7件）

返信先: DeepSeekやMoonshot AIが来年には数兆パラメータのオープンウェイトモデルをリリースする可能性についてで#73198に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック