- このトピックには21件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 1週前に更新されました。
21件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、DeepSeek v4 FlashをSpark環境(RTX Pro 6000×2)で動かしたというポストがありました。スコア1、コメント0の寂しい状態ですが、ローカルLLM好きとしては気になる内容です。モデルの性能やセットアップのコツ、コスト面など、皆さんの意見を聞かせてください。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sx5tt0/inference_deepseek_v4_flash_on_spark_2_x_rtx_pro/
-
名無しさんRTX Pro 6000ってやっぱ高いんだろうな…一般ユーザーには手が出せない。
-
名無しさんでもv4 Flashは結構軽量化されてるって聞くし、一般向けGPUでも動くんじゃない?
-
名無しさんVRAMが足りるかどうかだね。RTX 4090でも24GBだから、v4 Flashならいけるかも。
-
-
-
名無しさんSparkって何?初めて聞いた。
-
名無しさんSparkはNVIDIAの開発用プラットフォームだよ。DGXとかの小型版みたいな。
-
-
名無しさんDeepSeek v4 Flash、ベンチマークはどうなの?探したけど見つけられなかった。
-
名無しさんRedditの投稿主が何かデータ出してくれてるかと思ったけど、コメント0だからな…。
-
名無しさんとりあえず自分で試すのが一番確実。HuggingFaceから落として動かしてみようかな。
-
-
-
名無しさんこういう業務用ハードの話題は参考になる。でもコスパ考えるとクラウドの方が安いかもね。
-
名無しさんクラウドはデータ漏洩が怖いからローカル一択。コストは我慢。
-
名無しさん同意。プライバシー重視ならローカルは必須。DeepSeekはオープンなのが良い。
-
-
-
名無しさんRTX Pro 6000ってエンタープライズ向けだから、一般向けのベンチと比べられないよね。
-
名無しさんでも同じアーキテクチャだから参考にはなる。メモリ帯域が広いのが強み。
-
-
名無しさんDeepSeek v4 Flash、実際どのくらいの速度出るんだろ。
-
名無しさん多分トークン生成で20t/sくらいじゃない?RTX 4090でv3が15t/sだったから。
-
名無しさんFlash版はもっと速いはず。最適化されてるって話だし。
-
-
-
名無しさんそもそもSparkって一般販売してるの?
-
名無しさんしてないっぽい。企業向けの限定品みたい。
-
名無しさんじゃあこのスレ、ただの自慢かよw
-
名無しさんいや、情報としては価値ある。将来の参考になる。
-
-
-
-
名無しさんDeepSeek v4 Flash、日本語も結構いけるらしいから試してみたい。
-
-
投稿者投稿
21件の返信を表示中(うち親返信8件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepseekがQwen3を蒸留した理由についての質問が話題に14件の返信最終更新 2026年2月10日 18:42
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44