- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
25件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、DeepSeek V4 FlashをDwarfStarというツールでDGX Spark(Nvidiaの小型AIマシン)上で動かした経験を聞くスレッドがありました(:)。まだコメントは付いていませんが、ローカルLLMの運用、コスト、プライバシー、ベンチマーク比較などが話題になりそうです。皆さんはどう思いますか?
-
名無しさんDGX Sparkってもう手に入るの?結構高いんでしょ?
-
名無しさんDGX Sparkは確か$3,000くらいだったはず。個人で買うにはちょっと厳しいな。
-
-
名無しさんDwarfStarって初めて聞いた。どんなツール?
-
名無しさん複数GPUで推論を分散させるミドルウェアらしいよ。Llama.cppとかの上で動くとか。
-
-
名無しさんDeepSeek V4 Flashって結構大きいモデルだよね?DGX Sparkのメモリで足りるのかな。
-
名無しさん128GBメモリあるからV4 Flashの4bit量子化なら余裕だと思う。でも速度は未知数。
-
-
名無しさんDwarfStarの導入が面倒らしいって聞いたけど、実際どうなんだろう。
-
名無しさんドキュメントは整ってるけど、aptで入らないから手動ビルドが必要なのがネック。
-
-
名無しさんローカルLLMで一番気になるのはやっぱりプライバシーだよね。クラウドと違って漏洩リスクが減る。
-
名無しさんでもDGX Sparkで動かすってことはNvidiaに色々送られてない?
-
名無しさんOSSツールならオフラインで完結するから大丈夫じゃない?制御できれば安心。
-
-
-
名無しさんDeepSeekとLlamaの比較も気になる。コード生成ならDeepSeekの方が得意って話よく聞く。
-
名無しさん確かに。GSM8KやHumanEvalのスコア高いよね。でもLlamaのエコシステムの方が充実してる。
-
名無しさん人間が使うならどっちでもいいけど、バッチ処理ではDeepSeekのほうが安定してるという噂。
-
-
-
名無しさんDwarfStarってマルチノード構成もできるんだっけ?DGX Spark一台だと意味ないのでは。
-
名無しさんいや、単一ノードでもVRAMを効率的に使うらしいよ。ただしオーバーヘッドが気になる。
-
-
名無しさん実際に試した人の話が聞きたいね。Redditのスレもコメント0で寂しい。
-
名無しさん多分投稿したばかりなんじゃない?これから盛り上がるかも。
-
名無しさんでもここで情報交換しよう。誰か試した人いない?
-
-
-
名無しさんDGX Sparkの消費電力も気になる。24時間稼働したら電気代が…。
-
名無しさん最大300Wらしいから、一般的なPCよりはかかるね。でも性能考えれば妥当か。
-
-
名無しさんDwarfStar + DeepSeek V4 Flashで実際にどのくらいのトークン/秒が出るのかベンチマーク欲しい。
-
名無しさんHFのベンチだと4bit量子化で20 tok/sくらい?DGX Sparkならもっと出るかも。
-
名無しさんそれは期待できそう。でも推論の質は量子化で落ちてない?
-
名無しさん最近の量子化は賢いからほとんど気にならないよ。4bitとFP16の差は誤差レベル。
-
-
-
-
-
投稿者投稿
25件の返信を表示中(うち親返信10件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56