DeepSeekやLLaMAなどのオープンソースLLMを本番環境で使ってる人いますか？

名無しさん · 2025-10-29T04:52:42+09:00

Reddit r/LocalLLaMAで「Anybody using open-source LLMs (DeepSeek / LLaMA) in production?」というスレッドを見かけました。コメントはまだ0件ですが、オープンソースLLMの本番運用について話題になっています。DeepSeekやLLaMAを実際に業務で使っている方はいますか？コスト、精度、プライバシー面でのメリット・デメリット、コード生成や翻訳など具体的なユースケースを教えてください。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sm0492/anyone_here_using_opensource_llms_deepseek_llama/

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより7ヶ月、 4週前に更新されました。

27件の返信を表示中（うち親返信10件）

投稿者

投稿
- 2025年10月29日 4:52 AM #65582 返信
  
  名無しさん
  
  Reddit r/LocalLLaMAで「Anybody using open-source LLMs (DeepSeek / LLaMA) in production?」というスレッドを見かけました。コメントはまだ0件ですが、オープンソースLLMの本番運用について話題になっています。DeepSeekやLLaMAを実際に業務で使っている方はいますか？コスト、精度、プライバシー面でのメリット・デメリット、コード生成や翻訳など具体的なユースケースを教えてください。
  
  ソース: https://www.reddit.com/r/LocalLLaMA/comments/1sm0492/anyone_here_using_opensource_llms_deepseek_llama/
- 2025年10月29日 4:54 AM #65583 返信
  
  名無しさん
  
  社内のチャットボットにLlama 3.1 70B使ってるよ。やっぱりコード生成は精度高いわ。
  - 2025年10月29日 4:57 AM #65584 返信
    
    名無しさん
    
    70BってVRAMどれくらい必要なの？
    - 2025年10月29日 5:01 AM #65585 返信
      
      名無しさん
      
      量子化すれば24GBでも動くよ。でも80GB以上推奨。
- 2025年10月29日 5:08 AM #65586 返信
  
  名無しさん
  
  DeepSeek R1は数学系の推論が強いらしいね。試した人いる？
  - 2025年10月29日 5:10 AM #65587 返信
    
    名無しさん
    
    うちの研究チームで使ってるけど、証明問題とか結構すごい。でも日本語はLLaMAのほうが自然かも。
- 2025年10月29日 5:14 AM #65588 返信
  
  名無しさん
  
  プライバシーが理由でオープンソースに切り替えた。コスト面でもAPIより安い。ただし初期構築が面倒。
  - 2025年10月29日 5:20 AM #65589 返信
    
    名無しさん
    
    どのくらいのユーザー数まで耐えられる？スケールさせるのが心配。
    - 2025年10月29日 5:29 AM #65590 返信
      
      名無しさん
      
      小さなチームならvLLMとか使えば十分じゃない？ APIに課金する方が高いし。
- 2025年10月29日 5:30 AM #65591 返信
  
  名無しさん
  
  コード生成に使ってるけど、GPT-4と比べるとたまに変なコード吐く。でも微調整で改善できる。
  - 2025年10月29日 5:33 AM #65592 返信
    
    名無しさん
    
    微調整ってどのくらいのデータ必要？数千件で十分？
    - 2025年10月29日 5:37 AM #65593 返信
      
      名無しさん
      
      タスクによるけど、500件くらいでも効果感じるよ。LoRAがおすすめ。
- 2025年10月29日 5:43 AM #65594 返信
  
  名無しさん
  
  結局、GPT-4oのほうが楽って結論になりがち。社内政治もあって。
  - 2025年10月29日 5:55 AM #65595 返信
    
    名無しさん
    
    楽さで言えば確かに。でもコストが桁違いだから、ちゃんと比較すべき。
- 2025年10月29日 5:56 AM #65596 返信
  
  名無しさん
  
  DeepSeekって中国製だからセキュリティ的に大丈夫？
  - 2025年10月29日 5:59 AM #65597 返信
    
    名無しさん
    
    オープンソースなら自分で検証できるし、ローカルで動かせば問題ないでしょ。
    - 2025年10月29日 6:04 AM #65598 返信
      
      名無しさん
      
      それでも国家バックドアのリスクを気にする人もいるよね。でもLlamaもMetaだし結局どっちも。
- 2025年10月29日 6:12 AM #65599 返信
  
  名無しさん
  
  本番で使うならレイテンシが気になる。APIより遅いこと多い。
  - 2025年10月29日 6:14 AM #65600 返信
    
    名無しさん
    
    GPU積まないと厳しいよね。H100とか必要。
    - 2025年10月29日 6:18 AM #65601 返信
      
      名無しさん
      
      クラウドのGPUインスタンス使えば初期投資抑えられるけど、ランニングコスト考えると微妙。
- 2025年10月29日 6:23 AM #65602 返信
  
  名無しさん
  
  小規模なら7Bや8Bで十分って話もあるよね。用途次第。
  - 2025年10月29日 6:33 AM #65603 返信
    
    名無しさん
    
    簡単なQAなら3Bでも意外と使えるよ。チューニング次第。
- 2025年10月29日 6:35 AM #65604 返信
  
  名無しさん
  
  最近Mistralとかも出てきて選択肢増えたね。
  - 2025年10月29日 6:37 AM #65605 返信
    
    名無しさん
    
    Mistral Small 3.1は日本語微妙って聞いたけど。
    - 2025年10月29日 6:42 AM #65606 返信
      
      名無しさん
      
      実際に試してみないとわからないよね。ベンチマークだけじゃ測れない。
- 2025年10月29日 6:48 AM #65607 返信
  
  名無しさん
  
  長文要約に使いたいんだけど、open-source LLMだとコンテキスト長が短くて困る。
  - 2025年10月29日 7:00 AM #65608 返信
    
    名無しさん
    
    YaRNとか拡張手法使えば大丈夫だよ。128Kとかいける。
    - 2025年10月29日 7:02 AM #65609 返信
      
      名無しさん
      
      でもそうすると品質落ちることもあるから注意。
投稿者

投稿

27件の返信を表示中（うち親返信10件）

返信先: DeepSeekやLLaMAなどのオープンソースLLMを本番環境で使ってる人いますか？で#65605に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック