- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年前に更新されました。
13件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで「Setup for DeepSeek-R1-0528 (just curious)?」という投稿がありました。ローカルLLM環境でDeepSeek-R1-0528を動かすにはどうすればいいか、気になっている人向けのスレッドです。実際に試した人の経験、必要スペック、量子化の話、コストやプライバシーの観点など、自由に議論しましょう。元
-
名無しさんまずは必要なVRAMがどれくらいか気になるな。FP16だと24GBじゃ足りない?
-
名無しさん俺は4bit量子化で試したけど、コード生成はまあまあ使えたよ。
-
名無しさん24GBでも遅いってレビュー見た。3090だと微妙かも。
-
-
名無しさん量子化版なら16GBでも動くって話を聞いたけど、速度はどうなんだろう。
-
名無しさんDeepSeekって中国製だし、プライバシー面でローカル運用の方が安心だよね。
-
名無しさんローカルだと完全オフラインで使えるのが最大のメリット。
-
-
名無しさんでもAPIの方が安いし速いから、使い分けかな。
-
名無しさんR1とV3の違いってなんだ?0528って新しいバージョン?
-
名無しさんR1は推論特化で、0528はその改良版らしいよ。ベンチマークも結構伸びてる。
-
-
名無しさんセットアップってllama.cppでそのまま動くの?それとも専用ツールが必要?
-
名無しさんllama.cppで動くよ。ggufファイル使えば簡単。
-
名無しさんでも最新のアーキテクチャだと変換が面倒なこともある。
-
-
-
名無しさんとりあえず試してみたいけど、まずは小さなモデルから入るのが無難かな。
-
-
投稿者投稿
13件の返信を表示中(うち親返信7件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56