DeepSeek 4 FlashのMetal対応ローカル推論エンジンについて

名無しさん · 2025-02-22T08:50:56+09:00

このスレッドはRedditのr/LocalLLaMAで投稿された「DeepSeek 4 Flash local inference engine for Metal」に関する議論を元にしています。URL: このエンジンはApple SiliconでのローカルLLM実行に特化しており、パフォーマンスや精度、使い勝手についての話題が中心です。

このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。

16件の返信を表示中（うち親返信6件）

投稿者

投稿
- 2025年2月22日 8:50 AM #62714 返信
  
  名無しさん
  
  このスレッドはRedditのr/LocalLLaMAで投稿された「DeepSeek 4 Flash local inference engine for Metal」に関する議論を元にしています。URL: このエンジンはApple SiliconでのローカルLLM実行に特化しており、パフォーマンスや精度、使い勝手についての話題が中心です。
- 2025年2月22日 8:52 AM #62715 返信
  
  名無しさん
  
  これめっちゃ気になる。Metal対応ってことはMacで速いのかな？
  - 2025年2月22日 8:55 AM #62716 返信
    
    名無しさん
    
    実際試した人いる？速度感が知りたい。
- 2025年2月22日 8:59 AM #62717 返信
  
  名無しさん
  
  DeepSeekって他のモデルと比べてどうなん？コーディング向きって聞いたけど。
  - 2025年2月22日 9:06 AM #62718 返信
    
    名無しさん
    
    自分はコード生成で試したら結構良かったよ。ただ英語しかダメだった。
    - 2025年2月22日 9:08 AM #62719 返信
      
      名無しさん
      
      日本語も使えるモデルあるみたいだよ。でもFlash版は英語特化かも。
- 2025年2月22日 9:12 AM #62720 返信
  
  名無しさん
  
  Apple Siliconで動かすなら量子化が鍵だね。メモリ節約できるし。
  - 2025年2月22日 9:18 AM #62721 返信
    
    名無しさん
    
    4bit量子化で動かせばM2でも余裕かもしれない。
- 2025年2月22日 9:27 AM #62722 返信
  
  名無しさん
  
  そもそもDeepSeekって中国のモデルだよね。プライバシー的に大丈夫か？
  - 2025年2月22日 9:28 AM #62723 返信
    
    名無しさん
    
    ローカルならデータ漏洩の心配は少ないのでは？
    - 2025年2月22日 9:31 AM #62724 返信
      
      名無しさん
      
      Cloud使うより自分でホストした方が安心。
- 2025年2月22日 9:35 AM #62725 返信
  
  名無しさん
  
  ベンチマーク見たいな。llama.cppと比較した結果どこかにない？
  - 2025年2月22日 9:41 AM #62726 返信
    
    名無しさん
    
    Redditのスレにリンクあったよ。M3 MaxでTokens/sが結構出てた。
    - 2025年2月22日 9:53 AM #62727 返信
      
      名無しさん
      
      詳しく教えてくれ。どのくらいのパフォーマンスだった？
      - 2025年2月22日 9:55 AM #62728 返信
        
        名無しさん
        
        見た感じだと、DeepSeek 4 Flashはllama.cppより若干速いって書いてあった。
- 2025年2月22日 9:58 AM #62729 返信
  
  名無しさん
  
  でもモデルサイズが大きいから、メモリ16GBじゃ厳しいかも。
  - 2025年2月22日 10:02 AM #62730 返信
    
    名無しさん
    
    だから量子化が必要って話。Q4_K_Mくらいならギリギリ動くらしい。
投稿者

投稿

16件の返信を表示中（うち親返信6件）

返信先: DeepSeek 4 FlashのMetal対応ローカル推論エンジンについてで#62728に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック