大きなモデルを動かすのにデータセンターは不要?CPUオフロードで我慢すれば動くという議論

掲示板 フォーラム AI 大きなモデルを動かすのにデータセンターは不要?CPUオフロードで我慢すれば動くという議論

  • このトピックには17件の返信、5人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
17件の返信を表示中(うち親返信7件)
  • 投稿者
    投稿
    • #67796 返信
      名無しさん
      Reddit r/LocalLLaMAで「大きなモデル(DeepSeek, GLM, Kimiなど)を動かすのにデータセンターは必要ない。CPUにオフロードして我慢すれば十分」という投稿が話題になっていました。コメントでは、CPUオフロードの実際の速度、メモリ使用量、コスト、プライバシーのメリットなどが議論されています。また、DeepSeekのモデルサイズやベンチマーク比較についての意見も。ローカルLLMに興味がある方、どう思いますか?
      ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s1afhh/no_you_dont_need_a_datacenter_to_run_the_big/

    • #67797 返信
      名無しさん
      CPUオフロードって実際どれくらい遅いんだ?試した人いる?

      • #67798 返信
        名無しさん
        試したけど、70Bモデルで1トークンに数秒かかる。でもコード生成とかなら待てる範囲。

        • #67800 返信
          名無しさん
          数秒って結構きつくない?やっぱりGPUないと厳しいわ。

      • #67801 返信
        名無しさん
        オフロードの設定次第で結構変わるよ。レイヤーを全部CPUにすると遅いけど、一部だけならまだマシ。

    • #67799 返信
      名無しさん
      メモリさえあればとりあえず動くのがローカルのいいところだな。

    • #67802 返信
      名無しさん
      DeepSeekのR1とかV3って本当にCPUだけで動くの?それなりにRAM要るよね。

      • #67803 返信
        名無しさん
        動くには動くけど、128GB以上は欲しい。でも最近のPCならそこまで高くない。

    • #67804 返信
      名無しさん
      プライバシー面ではローカルが安心だけど、性能比べるとクラウドの方がコスパいい場合もあるな。

      • #67805 返信
        名無しさん
        クラウドはデータを渡すのが嫌だって人にはローカル一択。用途次第。

        • #67806 返信
          名無しさん
          API叩くより自分でモデル動かす方が勉強になるし、カスタマイズもできる。

    • #67807 返信
      名無しさん
      ベンチマークの数字だけ見るとやっぱりGPUのが上だけど、実用上はCPUでも十分って意見もあるよね。

      • #67808 返信
        名無しさん
        ベンチマークはともかく、日常的な翻訳や要約ならCPUでも問題ない。

        • #67809 返信
          名無しさん
          ただ、会話っぽい使い方だとレスポンス遅すぎてイライラするかも。

    • #67810 返信
      名無しさん
      GLMやKimiの日本語対応ってどうなの?試した人いる?

      • #67811 返信
        名無しさん
        DeepSeekよりはやや劣るけど、日本語でもそこそこ使えるよ。ただしプロンプト次第。

        • #67812 返信
          名無しさん
          中国語のモデルだからか、たまに変な日本語が混じることもある。

    • #67813 返信
      名無しさん
      結局はコストと速度のトレードオフ。とりあえず試すだけならCPUオフロードで十分だと思う。

17件の返信を表示中(うち親返信7件)
返信先: 大きなモデルを動かすのにデータセンターは不要?CPUオフロードで我慢すれば動くという議論で#67803に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました