- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより8ヶ月、 3週前に更新されました。
22件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっているDeepSeek V4のDGX Spark上でのFLASH推論パフォーマンスに関するスレッドのまとめです。ベンチマーク結果や他のモデルとの比較、ローカルLLM運用のコストやプライバシー面の議論が行われています。
-
名無しさんDGX SparkでDeepSeek V4のFLASHが動くって本当?ずっと気になってたんだよね。
-
名無しさん動くよ。FLASH対応のランタイム使えば結構速いらしい。ただメモリ消費がすごいって話も。
-
-
名無しさんベンチマーク見たけど、V4はコード生成が抜群にいいね。でも日本語はちょっと微妙な気がする。
-
名無しさん日本語はfine-tune次第じゃない?自分はLlama系の方が相性いいと思う。
-
名無しさん確かに。でもコスパ考えるとDeepSeekは魅力的。API使えば月額も安いし。
-
-
-
名無しさんDGX Sparkってコンシューマー向けのDGXだっけ?値段が高いって評判だけど、性能は本物なのかな。
-
名無しさん業務用の割には手が届く価格帯になったよね。でも個人で買うにはまだ勇気いる。
-
名無しさんレンタルするのが賢いかも。LambdaやVastで似たスペック借りた方が安いし。
-
-
-
名無しさんプライバシー重視ならローカル運用一択だよね。DeepSeek V4のFLASHはデータ漏洩リスク減らせるし。
-
名無しさんでもモデル自体が中国製なのが気になる人もいるみたい。まあオープンだから検証はできるけど。
-
名無しさん中国政府のバックドアが心配?実際コード見ればわかるし、そこまで paranoid になる必要ないと思う。
-
-
-
名無しさんベンチマークの数字だけ見るとClaudeやGPT-4oに迫ってるね。特に推論速度で勝ってる部分もある。
-
名無しさんでも実際に使うと精度はまだ一歩及ばない印象。でも進化のスピードがすごいから追い越すかも。
-
-
名無しさんFLASHって量子化版のこと?それとも新しいアーキテクチャ?
-
名無しさん両方だよ。FP8量子化とFlashAttentionの最適化が入ってるらしい。メモリ効率が劇的に向上してる。
-
名無しさんなるほど。それならVRAM 48GBくらいでも動くかもね。試してみたい。
-
-
-
名無しさんRedditのスレ見てたらDGX Sparkの価格に見合うかどうか議論してたよ。個人的にはクラウドでいいかな。
-
名無しさん電源と冷却面でも有利だしな。でもレイテンシ気にするならローカルもあり。
-
名無しさんレイテンシと言えば、V4の推論速度はNVLinkのおかげで優秀って話だね。
-
-
-
名無しさんコード生成で使ってるけど、最近のアップデートで精度上がった気がする。前より自然なコード吐くようになった。
-
名無しさん確かに。でも複雑なリファクタリングはまだ任せられないかな。
-
名無しさんまあ補助的に使う分には十分だよ。自分はVS Codeの拡張で使ってて便利。
-
-
-
-
投稿者投稿
22件の返信を表示中(うち親返信8件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34