- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 1ヶ月前に更新されました。
13件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっているスレッドです。DeepSeekやMoonshot AIといった企業が、来年には数兆パラメータ級のオープンウェイトモデルを出すかもしれないとの予測について議論されています。新しいアーキテクチャが開発されなければ、こうした巨大モデルが登場する可能性が高いとのこと。日本でもローカルLLMとして使えるか、コストやプライバシー面での懸念など、様々な意見があります。ッド:
-
名無しさん数兆パラメータって、もう人間の脳みそのシナプス数超えてるんじゃないか?そんなモデルをローカルで動かすのは無理だろ。
-
名無しさん量子化とか蒸留技術で小さくできるかもしれないけど、それでもRAMが何TBも必要になりそうだな。
-
名無しさんそれでもオープンウェイトならクラウドで使う分にはいいかもね。ただしAPI料金が高そう。
-
-
名無しさんDeepSeekって中国企業だよね?プライバシー的に大丈夫なのかな。
-
名無しさんオープンウェイトなら自分で検証できるから、プライバシーはある程度コントロールできると思う。でも学習データに中国の検閲が入ってる可能性はある。
-
-
名無しさんそもそもそんな巨大モデルって本当に必要なん?現状の70Bとかでも十分賢いし。
-
名無しさん専門的なタスクやマルチモーダルになるとまだまだ改良の余地はあるよ。でもコスト対効果が問題。
-
-
名無しさんベンチマークでどのくらい伸びるんだろうね。MMLUとかHumanEvalで劇的な差が出るなら価値あるかも。
-
名無しさん前にDeepSeekのモデルがコーディングで結構いいスコア出してたから、さらに上がったら凄いな。
-
-
名無しさんMoonshot AIってあまり聞かないけど、どんなとこ?
-
名無しさん中国のスタートアップで、Kimiという長文対応のモデルで有名。資金調達もしてるらしい。
-
-
名無しさんとにかく注目だわ。来年はLLM業界がまた大きく動きそう。
-
名無しさんでもアメリカの規制とかで中国からのオープンウェイトが制限される可能性もあるから、その辺も気になる。
-
-
投稿者投稿
13件の返信を表示中(うち親返信7件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56