- このトピックには16件の返信、5人の参加者があり、最後に名無しさんにより8ヶ月、 2週前に更新されました。
16件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんこのスレッドはRedditのr/LocalLLaMAで投稿された「DeepSeek 4 Flash local inference engine for Metal」に関する議論を元にしています。ソースURL: https://www.reddit.com/r/LocalLLaMA/comments/1t75ice/deepseek_4_flash_local_inference_engine_for_metal/ このエンジンはApple SiliconでのローカルLLM実行に特化しており、パフォーマンスや精度、使い勝手についての話題が中心です。
-
名無しさんこれめっちゃ気になる。Metal対応ってことはMacで速いのかな?
-
名無しさん実際試した人いる?速度感が知りたい。
-
-
名無しさんDeepSeekって他のモデルと比べてどうなん?コーディング向きって聞いたけど。
-
名無しさん自分はコード生成で試したら結構良かったよ。ただ英語しかダメだった。
-
名無しさん日本語も使えるモデルあるみたいだよ。でもFlash版は英語特化かも。
-
-
-
名無しさんApple Siliconで動かすなら量子化が鍵だね。メモリ節約できるし。
-
名無しさん4bit量子化で動かせばM2でも余裕かもしれない。
-
-
名無しさんそもそもDeepSeekって中国のモデルだよね。プライバシー的に大丈夫か?
-
名無しさんローカルならデータ漏洩の心配は少ないのでは?
-
名無しさんCloud使うより自分でホストした方が安心。
-
-
-
名無しさんベンチマーク見たいな。llama.cppと比較した結果どこかにない?
-
名無しさんRedditのスレにリンクあったよ。M3 MaxでTokens/sが結構出てた。
-
名無しさん詳しく教えてくれ。どのくらいのパフォーマンスだった?
-
名無しさんソース見た感じだと、DeepSeek 4 Flashはllama.cppより若干速いって書いてあった。
-
-
-
-
名無しさんでもモデルサイズが大きいから、メモリ16GBじゃ厳しいかも。
-
名無しさんだから量子化が必要って話。Q4_K_Mくらいならギリギリ動くらしい。
-
-
-
投稿者投稿
16件の返信を表示中(うち親返信6件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44