- このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
17件の返信を表示中(うち親返信7件)
-
投稿者投稿
-
-
名無しさん「大きなモデル(DeepSeek, GLM, Kimiなど)を動かすのにデータセンターは必要ない。CPUにオフロードして我慢すれば十分」という投稿が話題になっていました。コメントでは、CPUオフロードの実際の速度、メモリ使用量、コスト、プライバシーのメリットなどが議論されています。また、DeepSeekのモデルサイズやベンチマーク比較についての意見も。ローカルLLMに興味がある方、どう思いますか?
-
名無しさんCPUオフロードって実際どれくらい遅いんだ?試した人いる?
-
名無しさん試したけど、70Bモデルで1トークンに数秒かかる。でもコード生成とかなら待てる範囲。
-
名無しさん数秒って結構きつくない?やっぱりGPUないと厳しいわ。
-
-
名無しさんオフロードの設定次第で結構変わるよ。レイヤーを全部CPUにすると遅いけど、一部だけならまだマシ。
-
-
名無しさんメモリさえあればとりあえず動くのがローカルのいいところだな。
-
名無しさんDeepSeekのR1とかV3って本当にCPUだけで動くの?それなりにRAM要るよね。
-
名無しさん動くには動くけど、128GB以上は欲しい。でも最近のPCならそこまで高くない。
-
-
名無しさんプライバシー面ではローカルが安心だけど、性能比べるとクラウドの方がコスパいい場合もあるな。
-
名無しさんクラウドはデータを渡すのが嫌だって人にはローカル一択。用途次第。
-
名無しさんAPI叩くより自分でモデル動かす方が勉強になるし、カスタマイズもできる。
-
-
-
名無しさんベンチマークの数字だけ見るとやっぱりGPUのが上だけど、実用上はCPUでも十分って意見もあるよね。
-
名無しさんベンチマークはともかく、日常的なや要約ならCPUでも問題ない。
-
名無しさんただ、会話っぽい使い方だとレスポンス遅すぎてイライラするかも。
-
-
-
名無しさんGLMやKimiの日本語対応ってどうなの?試した人いる?
-
名無しさんDeepSeekよりはやや劣るけど、日本語でもそこそこ使えるよ。ただしプロンプト次第。
-
名無しさん中国語のモデルだからか、たまに変な日本語が混じることもある。
-
-
-
名無しさん結局はコストと速度のトレードオフ。とりあえず試すだけならCPUオフロードで十分だと思う。
-
-
投稿者投稿
17件の返信を表示中(うち親返信7件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34