- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより11ヶ月前に更新されました。
13件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMaに投稿された比較によると、M3 Ultra上でDeepSeek R1 70Bを動かす場合、MLXとllama.cppの推論速度はほぼ同じだが、チャットテンプレートの扱いが大きく異なるという。テンプレートを適切に設定しないと出力品質に差が出るらしい。
-
名無しさん速度同じならテンプレートが勝負か。やっぱりllama.cppの方がテンプレート管理しやすい気がする。
-
名無しさんいや、MLXも結構柔軟だよ。特にApple SiliconならMLXの方が最適化されてる。
-
名無しさん3に同意。M3 Ultraだとメモリ帯域が重要だし、MLXの方がメモリ効率いいって話もある。
-
-
名無しさんただ、チャットテンプレートで差が出るってのは初耳。具体的にどんなテンプレート使ってたの?
-
名無しさん多分、システムプロンプトのフォーマットとか、ターン区切りの違いじゃない?DeepSeekは特殊だからな。
-
-
名無しさんそもそもDeepSeek R1 70Bをローカルで動かす意味ある?クラウドの方が安くない?
-
名無しさんプライバシー重視ならローカル一択。それに一度買えば追加コストなし。
-
-
名無しさん速度同じなら、どっちでもいいんじゃない?好みの問題。
-
名無しさんでもテンプレートの違いで生成品質が変わるなら、実用的には重要だよ。
-
-
名無しさんllama.cppの方がコミュニティ大きくてサポート充実してるから安心。
-
名無しさん確かに。でもMLXはApple公式に近いし、将来性あるかも。
-
-
名無しさん実際に両方試したけど、どちらも遅い。M3 Ultraでも70Bは厳しい。
-
名無しさん量子化すれば大丈夫。Q4_K_Mくらいなら問題なく動くはず。
-
-
-
投稿者投稿
13件の返信を表示中(うち親返信7件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01