- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
25件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっているDeepSeek V4のアナウンスについてです。総パラメータ1T、アクティブ35BのMoEモデルで、Apache 2.0ライセンスでの公開が約束されています。ベンチマークでは既存モデルを凌ぐ性能が示唆されており、ローカル実行の可能性やコード生成能力に注目が集まっています。
-
名無しさんついに来たか!1Tパラメータってすごいな。でもアクティブは35Bならローカルでもなんとかなるのか?
-
名無しさん35BアクティブでもVRAM16GBじゃ厳しいと思う。量子化すればいけるかもしれんが。
-
-
名無しさんApache 2.0なのが嬉しい。商用利用も安心だ。
-
名無しさんでもライセンスって後で変わることあるからな。約束だけじゃ信用できん。
-
-
名無しさんMoEのモデルは推論が速いって聞くけど、実際どうなんだろう。
-
名無しさんDeepSeek V2とかも良かったからV4も期待できる。コード生成が得意らしい。
-
-
名無しさん1Tパラメータって学習にどれだけ金かかってるんだ…中国の企業は潤沢だな。
-
名無しさんでもオープンにしてくれるのはありがたい。研究が進む。
-
-
名無しさんベンチマークの数字だけ見るとClaudeやGPT-4超え?でも過学習の可能性もあるしな。
-
名無しさん確かに。実用的なタスクで試さないと分からん。でも競争が激しくなっていいことだ。
-
-
名無しさんローカルで動かすならllama.cpp対応してほしい。今から楽しみ。
-
名無しさん多分すぐ対応するだろ。コミュニティが熱いから。
-
-
名無しさんでもDeepSeekって中国企業じゃん?データの扱いとか大丈夫か?
-
名無しさんオープンならコード見れるから安心。プライバシーは自分で管理すればいい。
-
名無しさんとはいえ学習データに何使ってるか分からんし、バイアスは気になる。
-
-
-
名無しさんとりあえずリリースされたらすぐ試すわ。RTX4090で動くかな?
-
名無しさん35Bアクティブなら4bit量子化で24GBくらい?4090じゃ厳しいかも。
-
名無しさんじゃあ3090でも無理か…マルチGPU必須か。
-
-
-
名無しさんAPIで使う分には問題ないな。価格次第だが。
-
名無しさんDeepSeekのAPIは安いから期待してる。V4も同じくらいの価格帯なら嬉しい。
-
-
名無しさんApache 2.0なら自分のプロジェクトに組み込みやすい。これは大きい。
-
名無しさんRedditでは結構盛り上がってたな。でも25コメントしかないのは意外。
-
名無しさん話題になるのはこれからだよ。リリースされたら爆発的に伸びる。
-
-
名無しさん個人的にはコード生成の性能が気になる。V3でも結構良かったし。
-
名無しさんMoEは得意分野に特化したエキスパートがいるから、コード特化のエキスパートがあるといいな。
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信12件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56