- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
22件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっているDeepSeek V4のDGX Spark上でのFLASH推論パフォーマンスに関するスレッドのまとめです。ベンチマーク結果や他のモデルとの比較、ローカルLLM運用のコストやプライバシー面の議論が行われています。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1ttlp99/deepseek_v4_flash_performance_on_dgx_spark/
-
名無しさんDGX SparkでDeepSeek V4のFLASHが動くって本当?ずっと気になってたんだよね。
-
名無しさん動くよ。FLASH対応のランタイム使えば結構速いらしい。ただメモリ消費がすごいって話も。
-
-
名無しさんベンチマーク見たけど、V4はコード生成が抜群にいいね。でも日本語はちょっと微妙な気がする。
-
名無しさん日本語はfine-tune次第じゃない?自分はLlama系の方が相性いいと思う。
-
名無しさん確かに。でもコスパ考えるとDeepSeekは魅力的。API使えば月額も安いし。
-
-
-
名無しさんDGX Sparkってコンシューマー向けのDGXだっけ?値段が高いって評判だけど、性能は本物なのかな。
-
名無しさん業務用の割には手が届く価格帯になったよね。でも個人で買うにはまだ勇気いる。
-
名無しさんレンタルするのが賢いかも。LambdaやVastで似たスペック借りた方が安いし。
-
-
-
名無しさんプライバシー重視ならローカル運用一択だよね。DeepSeek V4のFLASHはデータ漏洩リスク減らせるし。
-
名無しさんでもモデル自体が中国製なのが気になる人もいるみたい。まあオープンソースだから検証はできるけど。
-
名無しさん中国政府のバックドアが心配?実際ソースコード見ればわかるし、そこまで paranoid になる必要ないと思う。
-
-
-
名無しさんベンチマークの数字だけ見るとClaudeやGPT-4oに迫ってるね。特に推論速度で勝ってる部分もある。
-
名無しさんでも実際に使うと精度はまだ一歩及ばない印象。でも進化のスピードがすごいから追い越すかも。
-
-
名無しさんFLASHって量子化版のこと?それとも新しいアーキテクチャ?
-
名無しさん両方だよ。FP8量子化とFlashAttentionの最適化が入ってるらしい。メモリ効率が劇的に向上してる。
-
名無しさんなるほど。それならVRAM 48GBくらいでも動くかもね。試してみたい。
-
-
-
名無しさんRedditのスレ見てたらDGX Sparkの価格に見合うかどうか議論してたよ。個人的にはクラウドでいいかな。
-
名無しさん電源と冷却面でも有利だしな。でもレイテンシ気にするならローカルもあり。
-
名無しさんレイテンシと言えば、V4の推論速度はNVLinkのおかげで優秀って話だね。
-
-
-
名無しさんコード生成で使ってるけど、最近のアップデートで精度上がった気がする。前より自然なコード吐くようになった。
-
名無しさん確かに。でも複雑なリファクタリングはまだ任せられないかな。
-
名無しさんまあ補助的に使う分には十分だよ。自分はVS Codeの拡張で使ってて便利。
-
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信8件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44