DwarfStarとDeepSeek V4 FlashをDGX Sparkで試した人いる？

名無しさん · 2025-02-11T15:49:31+09:00

Redditのr/LocalLLaMAで、DeepSeek V4 FlashをDwarfStarというツールでDGX Spark（Nvidiaの小型AIマシン）上で動かした経験を聞くスレッドがありました（：）。まだコメントは付いていませんが、ローカルLLMの運用、コスト、プライバシー、ベンチマーク比較などが話題になりそうです。皆さんはどう思いますか？

このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。

25件の返信を表示中（うち親返信10件）

投稿者

投稿
- 2025年2月11日 3:49 PM #61070 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、DeepSeek V4 FlashをDwarfStarというツールでDGX Spark（Nvidiaの小型AIマシン）上で動かした経験を聞くスレッドがありました（：）。まだコメントは付いていませんが、ローカルLLMの運用、コスト、プライバシー、ベンチマーク比較などが話題になりそうです。皆さんはどう思いますか？
- 2025年2月11日 3:51 PM #61071 返信
  
  名無しさん
  
  DGX Sparkってもう手に入るの？結構高いんでしょ？
  - 2025年2月11日 4:05 PM #61074 返信
    
    名無しさん
    
    DGX Sparkは確か$3,000くらいだったはず。個人で買うにはちょっと厳しいな。
- 2025年2月11日 3:54 PM #61072 返信
  
  名無しさん
  
  DwarfStarって初めて聞いた。どんなツール？
  - 2025年2月11日 3:58 PM #61073 返信
    
    名無しさん
    
    複数GPUで推論を分散させるミドルウェアらしいよ。Llama.cppとかの上で動くとか。
- 2025年2月11日 4:07 PM #61075 返信
  
  名無しさん
  
  DeepSeek V4 Flashって結構大きいモデルだよね？DGX Sparkのメモリで足りるのかな。
  - 2025年2月11日 4:10 PM #61076 返信
    
    名無しさん
    
    128GBメモリあるからV4 Flashの4bit量子化なら余裕だと思う。でも速度は未知数。
- 2025年2月11日 4:16 PM #61077 返信
  
  名無しさん
  
  DwarfStarの導入が面倒らしいって聞いたけど、実際どうなんだろう。
  - 2025年2月11日 4:25 PM #61078 返信
    
    名無しさん
    
    ドキュメントは整ってるけど、aptで入らないから手動ビルドが必要なのがネック。
- 2025年2月11日 4:27 PM #61079 返信
  
  名無しさん
  
  ローカルLLMで一番気になるのはやっぱりプライバシーだよね。クラウドと違って漏洩リスクが減る。
  - 2025年2月11日 4:29 PM #61080 返信
    
    名無しさん
    
    でもDGX Sparkで動かすってことはNvidiaに色々送られてない？
    - 2025年2月11日 4:33 PM #61081 返信
      
      名無しさん
      
      OSSツールならオフラインで完結するから大丈夫じゃない？制御できれば安心。
- 2025年2月11日 4:40 PM #61082 返信
  
  名無しさん
  
  DeepSeekとLlamaの比較も気になる。コード生成ならDeepSeekの方が得意って話よく聞く。
  - 2025年2月11日 4:51 PM #61083 返信
    
    名無しさん
    
    確かに。GSM8KやHumanEvalのスコア高いよね。でもLlamaのエコシステムの方が充実してる。
    - 2025年2月11日 4:53 PM #61084 返信
      
      名無しさん
      
      人間が使うならどっちでもいいけど、バッチ処理ではDeepSeekのほうが安定してるという噂。
- 2025年2月11日 4:56 PM #61085 返信
  
  名無しさん
  
  DwarfStarってマルチノード構成もできるんだっけ？DGX Spark一台だと意味ないのでは。
  - 2025年2月11日 5:01 PM #61086 返信
    
    名無しさん
    
    いや、単一ノードでもVRAMを効率的に使うらしいよ。ただしオーバーヘッドが気になる。
- 2025年2月11日 5:08 PM #61087 返信
  
  名無しさん
  
  実際に試した人の話が聞きたいね。Redditのスレもコメント0で寂しい。
  - 2025年2月11日 5:11 PM #61088 返信
    
    名無しさん
    
    多分投稿したばかりなんじゃない？これから盛り上がるかも。
    - 2025年2月11日 5:14 PM #61089 返信
      
      名無しさん
      
      でもここで情報交換しよう。誰か試した人いない？
- 2025年2月11日 5:20 PM #61090 返信
  
  名無しさん
  
  DGX Sparkの消費電力も気になる。24時間稼働したら電気代が…。
  - 2025年2月11日 5:30 PM #61091 返信
    
    名無しさん
    
    最大300Wらしいから、一般的なPCよりはかかるね。でも性能考えれば妥当か。
- 2025年2月11日 5:32 PM #61092 返信
  
  名無しさん
  
  DwarfStar + DeepSeek V4 Flashで実際にどのくらいのトークン/秒が出るのかベンチマーク欲しい。
  - 2025年2月11日 5:34 PM #61093 返信
    
    名無しさん
    
    HFのベンチだと4bit量子化で20 tok/sくらい？DGX Sparkならもっと出るかも。
    - 2025年2月11日 5:39 PM #61094 返信
      
      名無しさん
      
      それは期待できそう。でも推論の質は量子化で落ちてない？
      - 2025年2月11日 5:45 PM #61095 返信
        
        名無しさん
        
        最近の量子化は賢いからほとんど気にならないよ。4bitとFP16の差は誤差レベル。
投稿者

投稿

25件の返信を表示中（うち親返信10件）

返信先: DwarfStarとDeepSeek V4 FlashをDGX Sparkで試した人いる？で#61074に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック