- このトピックには19件の返信、6人の参加者があり、最後に名無しさんにより1年、 4ヶ月前に更新されました。
19件の返信を表示中(うち親返信9件)
-
投稿者投稿
-
-
名無しさんDeepSeek 4 FlashをMac M3 Max(96GBメモリ)で実行できたというRedditの投稿が話題です。ローカルLLMの活用、コーディング支援、コスト、プライバシー、ベンチマーク比較などについて議論されています。ッド:
-
名無しさん96GBもあればさすがに動くか。でもM3 MaxのGPU性能がどの程度か気になる。
-
名無しさんApple Siliconはメモリ帯域幅が広いから推論には向いてるらしいよ。FP8なら結構速いって話。
-
名無しさん実際に試した人いる?DeepSeekの品質はどうなんだろう。
-
名無しさん自分はM2 Ultra 192GBでやってるけど、4-flashは結構使える。コード生成が得意らしい。
-
-
-
-
名無しさんクラウドAPI使うよりローカルのほうがコスト抑えられるね。プライバシーも安心。
-
名無しさんでもVRAMが96GB必要ってハードル高くない?一般ユーザーには無理だわ。
-
名無しさん量子化すればもっと少ないメモリで動くかも。GGUF形式とか試してみたい。
-
-
名無しさんベンチマーク見るとLlama 3.1 70Bと互角らしいけど、実際の使用感はどうなんだろ。
-
名無しさん自分で試した限りでは、コード生成はDeepSeekの方が好み。ただし日本語は微妙かも。
-
-
名無しさんMacで動かすならllama.cppが鉄板。Metalでちゃんと動くんだよね。
-
名無しさんMetalは安定してる?前はバグあったけど最近改善されたって聞いた。
-
名無しさん最新版では大丈夫みたい。自分は問題なく使えてる。
-
-
-
名無しさん96GBモデルでも70B動かすのはきついんじゃない?DeepSeek 4 Flashはパラメータ数いくつだっけ。
-
名無しさん確か236Bらしいけど、MoEだから有効パラメータは少ないんだよね。だからメモリ節約になる。
-
-
名無しさんこのスレ見てM3 Maxの購入検討し始めた。でも値段が…
-
名無しさん中古で買う手もあるよ。でも待てばM4 Ultraが出るかも。
-
-
名無しさんローカルLLMの未来はApple Siliconにあるのかな?NVIDIA一辺倒じゃなくなるかも。
-
名無しさんとはいえCUDAのエコシステムは強いし、研究用ならNVIDIA一択だと思う。
-
-
名無しさんとりあえず試してみたい人は、Ollamaで手軽にできるよ。ただしモデルのダウンロードが重いけど。
-
-
投稿者投稿
19件の返信を表示中(うち親返信9件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56