DeepSeekやLLaMAなどのオープンソースLLMを本番環境で使ってる人いますか?

掲示板 フォーラム AI DeepSeekやLLaMAなどのオープンソースLLMを本番環境で使ってる人いますか?

  • このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 4週前に更新されました。
27件の返信を表示中(うち親返信10件)
  • 投稿者
    投稿
    • #65582 返信
      名無しさん
      Reddit r/LocalLLaMAで「Anybody using open-source LLMs (DeepSeek / LLaMA) in production?」というスレッドを見かけました。コメントはまだ0件ですが、オープンソースLLMの本番運用について話題になっています。DeepSeekやLLaMAを実際に業務で使っている方はいますか?コスト、精度、プライバシー面でのメリット・デメリット、コード生成や翻訳など具体的なユースケースを教えてください。

      ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sm0492/anyone_here_using_opensource_llms_deepseek_llama/

    • #65583 返信
      名無しさん
      社内のチャットボットにLlama 3.1 70B使ってるよ。やっぱりコード生成は精度高いわ。

      • #65584 返信
        名無しさん
        70BってVRAMどれくらい必要なの?

        • #65585 返信
          名無しさん
          量子化すれば24GBでも動くよ。でも80GB以上推奨。

    • #65586 返信
      名無しさん
      DeepSeek R1は数学系の推論が強いらしいね。試した人いる?

      • #65587 返信
        名無しさん
        うちの研究チームで使ってるけど、証明問題とか結構すごい。でも日本語はLLaMAのほうが自然かも。

    • #65588 返信
      名無しさん
      プライバシーが理由でオープンソースに切り替えた。コスト面でもAPIより安い。ただし初期構築が面倒。

      • #65589 返信
        名無しさん
        どのくらいのユーザー数まで耐えられる?スケールさせるのが心配。

        • #65590 返信
          名無しさん
          小さなチームならvLLMとか使えば十分じゃない? APIに課金する方が高いし。

    • #65591 返信
      名無しさん
      コード生成に使ってるけど、GPT-4と比べるとたまに変なコード吐く。でも微調整で改善できる。

      • #65592 返信
        名無しさん
        微調整ってどのくらいのデータ必要?数千件で十分?

        • #65593 返信
          名無しさん
          タスクによるけど、500件くらいでも効果感じるよ。LoRAがおすすめ。

    • #65594 返信
      名無しさん
      結局、GPT-4oのほうが楽って結論になりがち。社内政治もあって。

      • #65595 返信
        名無しさん
        楽さで言えば確かに。でもコストが桁違いだから、ちゃんと比較すべき。

    • #65596 返信
      名無しさん
      DeepSeekって中国製だからセキュリティ的に大丈夫?

      • #65597 返信
        名無しさん
        オープンソースなら自分で検証できるし、ローカルで動かせば問題ないでしょ。

        • #65598 返信
          名無しさん
          それでも国家バックドアのリスクを気にする人もいるよね。でもLlamaもMetaだし結局どっちも。

    • #65599 返信
      名無しさん
      本番で使うならレイテンシが気になる。APIより遅いこと多い。

      • #65600 返信
        名無しさん
        GPU積まないと厳しいよね。H100とか必要。

        • #65601 返信
          名無しさん
          クラウドのGPUインスタンス使えば初期投資抑えられるけど、ランニングコスト考えると微妙。

    • #65602 返信
      名無しさん
      小規模なら7Bや8Bで十分って話もあるよね。用途次第。

      • #65603 返信
        名無しさん
        簡単なQAなら3Bでも意外と使えるよ。チューニング次第。

    • #65604 返信
      名無しさん
      最近Mistralとかも出てきて選択肢増えたね。

      • #65605 返信
        名無しさん
        Mistral Small 3.1は日本語微妙って聞いたけど。

        • #65606 返信
          名無しさん
          実際に試してみないとわからないよね。ベンチマークだけじゃ測れない。

    • #65607 返信
      名無しさん
      長文要約に使いたいんだけど、open-source LLMだとコンテキスト長が短くて困る。

      • #65608 返信
        名無しさん
        YaRNとか拡張手法使えば大丈夫だよ。128Kとかいける。

        • #65609 返信
          名無しさん
          でもそうすると品質落ちることもあるから注意。

27件の返信を表示中(うち親返信10件)
返信先: DeepSeekやLLaMAなどのオープンソースLLMを本番環境で使ってる人いますか?で#65605に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました