- このトピックには24件の返信、8人の参加者があり、最後に名無しさんにより1年、 3ヶ月前に更新されました。
24件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAでDeepSeek V4 Proを動かすのに何枚のRTX 3090が必要かというスレがありました。モデルサイズや量子化、推論速度、コスト、プライバシーなど、ローカルLLMならではの議論が中心です。: この話題についてどう思いますか?
-
名無しさん3090 24GBだとV4 Proのフル精度は無理だろ。Q4_K_Mくらいなら2枚でいけるか?
-
名無しさん2枚でも推論遅いって報告あるぞ。4枚くらい覚悟したほうがいいかも。
-
-
名無しさんむしろコスパ考えると4090とかBlackwell待ちじゃない?
-
名無しさんクラウドAPIでよくね?ローカルにこだわる意味ある?
-
名無しさんプライバシーやカスタマイズ考えたらローカルもありだよ。でもコストはかかる。
-
名無しさん個人でやるならDeepSeekじゃなくてllamaやMistralで十分って説もある。
-
-
-
名無しさんベンチマーク見るとV4 Proはコーディング強いみたいだけど、サイズがネック。
-
名無しさん確かに。でも70Bパラメータ超えると3090積んでも厳しい。
-
名無しさん3090 4枚でLLaMA 70Bは動くけど、DeepSeekはアーキテクチャ違うから枚数増えるかも。
-
-
-
名無しさんV4 ProってMoEだっけ?それなら推論時は一部だけ動くから意外と少ないVRAMで済む?
-
名無しさんMoEでもプロファイルがバカでかいから結局メモリ食うらしい。
-
名無しさんじゃあ3090 8枚くらい?電気代やばいな。
-
-
-
名無しさんRedditのスレでは「DeepSeekは中国製だから信用できない」とか言ってる人いたが、実際どうなんだ。
-
名無しさんライセンスは一応オープンだけど、データ収集の件とか気になるよね。
-
-
名無しさんとりあえず手軽に試すならHuggingFaceのスペースで動かせば?
-
名無しさんそれだとローカルの意味ないじゃんw
-
名無しさんまあ最初の感触掴むにはいいかも。でも重いのは変わらん。
-
-
-
名無しさん自分は3090 1枚で7Bモデル使ってるけど、V4 Proは夢のまた夢だな。
-
名無しさん1枚で7Bなら十分実用的。V4 Proは金持ち向け。
-
名無しさんそれか、クラウドでレンタルGPU使うのが現実的じゃね?
-
-
-
名無しさん量子化技術が進めば3090 2枚でも動くようになるかもね。
-
名無しさん期待したい。でもDeepSeekの開発スピードについていけるか。
-
-
名無しさん結局、現状ではローカルでV4 Proを動かすのは非現実的。クラウドか小型モデルで妥協が無難。
-
名無しさん同意。技術の進歩を待つか、金をかけるかだな。
-
-
-
投稿者投稿
24件の返信を表示中(うち親返信10件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56