DeepSeek 4 FlashのMetal対応ローカル推論エンジンについて

名無しさん · 2025-10-10T12:12:27+09:00

このスレッドはRedditのr/LocalLLaMAで投稿された「DeepSeek 4 Flash local inference engine for Metal」に関する議論を元にしています。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1t75ice/deepseek_4_flash_local_inference_engine_for_metal/ このエンジンはApple SiliconでのローカルLLM実行に特化しており、パフォーマンスや精度、使い勝手についての話題が中心です。

このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。

16件の返信を表示中（うち親返信6件）

投稿者

投稿
- 2025年10月10日 12:12 PM #62714 返信
  
  名無しさん
  
  このスレッドはRedditのr/LocalLLaMAで投稿された「DeepSeek 4 Flash local inference engine for Metal」に関する議論を元にしています。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1t75ice/deepseek_4_flash_local_inference_engine_for_metal/ このエンジンはApple SiliconでのローカルLLM実行に特化しており、パフォーマンスや精度、使い勝手についての話題が中心です。
- 2025年10月10日 12:14 PM #62715 返信
  
  名無しさん
  
  これめっちゃ気になる。Metal対応ってことはMacで速いのかな？
  - 2025年10月10日 12:17 PM #62716 返信
    
    名無しさん
    
    実際試した人いる？速度感が知りたい。
- 2025年10月10日 12:21 PM #62717 返信
  
  名無しさん
  
  DeepSeekって他のモデルと比べてどうなん？コーディング向きって聞いたけど。
  - 2025年10月10日 12:28 PM #62718 返信
    
    名無しさん
    
    自分はコード生成で試したら結構良かったよ。ただ英語しかダメだった。
    - 2025年10月10日 12:30 PM #62719 返信
      
      名無しさん
      
      日本語も使えるモデルあるみたいだよ。でもFlash版は英語特化かも。
- 2025年10月10日 12:33 PM #62720 返信
  
  名無しさん
  
  Apple Siliconで動かすなら量子化が鍵だね。メモリ節約できるし。
  - 2025年10月10日 12:39 PM #62721 返信
    
    名無しさん
    
    4bit量子化で動かせばM2でも余裕かもしれない。
- 2025年10月10日 12:48 PM #62722 返信
  
  名無しさん
  
  そもそもDeepSeekって中国のモデルだよね。プライバシー的に大丈夫か？
  - 2025年10月10日 12:50 PM #62723 返信
    
    名無しさん
    
    ローカルならデータ漏洩の心配は少ないのでは？
    - 2025年10月10日 12:52 PM #62724 返信
      
      名無しさん
      
      Cloud使うより自分でホストした方が安心。
- 2025年10月10日 12:56 PM #62725 返信
  
  名無しさん
  
  ベンチマーク見たいな。llama.cppと比較した結果どこかにない？
  - 2025年10月10日 1:03 PM #62726 返信
    
    名無しさん
    
    Redditのスレにリンクあったよ。M3 MaxでTokens/sが結構出てた。
    - 2025年10月10日 1:14 PM #62727 返信
      
      名無しさん
      
      詳しく教えてくれ。どのくらいのパフォーマンスだった？
      - 2025年10月10日 1:16 PM #62728 返信
        
        名無しさん
        
        ソース見た感じだと、DeepSeek 4 Flashはllama.cppより若干速いって書いてあった。
- 2025年10月10日 1:19 PM #62729 返信
  
  名無しさん
  
  でもモデルサイズが大きいから、メモリ16GBじゃ厳しいかも。
  - 2025年10月10日 1:24 PM #62730 返信
    
    名無しさん
    
    だから量子化が必要って話。Q4_K_Mくらいならギリギリ動くらしい。
投稿者

投稿

16件の返信を表示中（うち親返信6件）

返信先: DeepSeek 4 FlashのMetal対応ローカル推論エンジンについてで#62718に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック