- このトピックには26件の返信、8人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
26件の返信を表示中(うち親返信14件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAで投稿されたDeepSeek V4 Flashのベンチマークの話題です。Dual DGX Sparks構成で1Mコンテキスト時に40tk/s、集約で350tk/sだったそうです。比較対象としてRTX Pro 6000やMac M2 Ultra(192GB)も載ってました。ローカルLLM環境の性能差が気になるスレッドですね。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1u5g9pr/dual_dgx_sparks_40tks_single_1m_350_tks_agg/
-
名無しさんDGX Sparksってやっぱすごいな。でも値段がなあ…
-
名無しさん値段は気にしたら負け。個人で買うものじゃないし
-
-
名無しさん1Mコンテキストで40tk/sは実用的?コード補完とかには十分かも
-
名無しさんMac M2 Ultra 192GBがこれにどこまで迫れるのか気になる
-
名無しさんM2 Ultraだとメモリ帯域がネックじゃない?
-
-
名無しさんDeepSeek V4 Flashって量子化モデルだよね?FP8とか?
-
名無しさんたぶんFP8量子化。RTX Pro 6000でも似たような速度出るらしい
-
-
名無しさん350tk/sの集約って、どうやって計測したんだろう?
-
名無しさん恐らくtensor並列とパイプライン並列の合計値
-
-
名無しさんこういうベンチを見ると、自前でクラスタ組むのはコスパ悪いな
-
名無しさんでもレンタルよりは長期的に安い場合もある
-
-
名無しさん1Mコンテキストって実際どのくらい使うんだろう
-
名無しさんコードベース全体とか長文解析には便利
-
-
名無しさんこのスピードならリアルタイム翻訳にも使えそう
-
名無しさんでも遅延は別問題だよね
-
-
名無しさんRTX Pro 6000ってゲーミングカードより高いのに性能どうなの?
-
名無しさんメモリ増えてるけど、DGX Sparksには敵わないみたい
-
-
名無しさんこういう比較見ると、Apple Siliconの統合メモリは便利だけど速度で負ける
-
名無しさんでも手軽さではMacが上。セットアップ簡単
-
-
名無しさんDGX Sparksの消費電力はどれくらい?
-
名無しさん多分2000W超え。冷却も大変そう
-
-
名無しさん個人的にはAMDのMI300Xも気になる
-
名無しさんROCmの互換性がネックだと思う
-
-
名無しさんこのベンチマーク、モデルのバージョンはDeepSeek V4 Flashで固定?
-
名無しさんたぶん量子化の度合いも同じはず
-
-
名無しさん次はConsumer GPUでの比較も見てみたい
-
-
投稿者投稿
26件の返信を表示中(うち親返信14件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44