- このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
17件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさんReddit r/LocalLLaMAで「大きなモデル(DeepSeek, GLM, Kimiなど)を動かすのにデータセンターは必要ない。CPUにオフロードして我慢すれば十分」という投稿が話題になっていました。コメントでは、CPUオフロードの実際の速度、メモリ使用量、コスト、プライバシーのメリットなどが議論されています。また、DeepSeekのモデルサイズやベンチマーク比較についての意見も。ローカルLLMに興味がある方、どう思いますか?
ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s1afhh/no_you_dont_need_a_datacenter_to_run_the_big/ -
名無しさんCPUオフロードって実際どれくらい遅いんだ?試した人いる?
-
名無しさん試したけど、70Bモデルで1トークンに数秒かかる。でもコード生成とかなら待てる範囲。
-
名無しさん数秒って結構きつくない?やっぱりGPUないと厳しいわ。
-
-
名無しさんオフロードの設定次第で結構変わるよ。レイヤーを全部CPUにすると遅いけど、一部だけならまだマシ。
-
-
名無しさんメモリさえあればとりあえず動くのがローカルのいいところだな。
-
名無しさんDeepSeekのR1とかV3って本当にCPUだけで動くの?それなりにRAM要るよね。
-
名無しさん動くには動くけど、128GB以上は欲しい。でも最近のPCならそこまで高くない。
-
-
名無しさんプライバシー面ではローカルが安心だけど、性能比べるとクラウドの方がコスパいい場合もあるな。
-
名無しさんクラウドはデータを渡すのが嫌だって人にはローカル一択。用途次第。
-
名無しさんAPI叩くより自分でモデル動かす方が勉強になるし、カスタマイズもできる。
-
-
-
名無しさんベンチマークの数字だけ見るとやっぱりGPUのが上だけど、実用上はCPUでも十分って意見もあるよね。
-
名無しさんベンチマークはともかく、日常的な翻訳や要約ならCPUでも問題ない。
-
名無しさんただ、会話っぽい使い方だとレスポンス遅すぎてイライラするかも。
-
-
-
名無しさんGLMやKimiの日本語対応ってどうなの?試した人いる?
-
名無しさんDeepSeekよりはやや劣るけど、日本語でもそこそこ使えるよ。ただしプロンプト次第。
-
名無しさん中国語のモデルだからか、たまに変な日本語が混じることもある。
-
-
-
名無しさん結局はコストと速度のトレードオフ。とりあえず試すだけならCPUオフロードで十分だと思う。
-
-
投稿者投稿
17件の返信を表示中(うち親返信7件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44