DeepSeekやLLaMAなどのオープンLLMを本番環境で使ってる人いますか？

名無しさん · 2025-07-13T17:15:03+09:00

「Anybody using open-source LLMs (DeepSeek / LLaMA) in production?」というスレッドを見かけました。コメントはまだ0件ですが、オープンLLMの本番運用について話題になっています。DeepSeekやLLaMAを実際に業務で使っている方はいますか？コスト、精度、プライバシー面でのメリット・デメリット、コード生成やなど具体的なユースケースを教えてください。

このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより11ヶ月、 2週前に更新されました。

27件の返信を表示中（うち親返信10件）

投稿者

投稿
- 2025年7月13日 5:15 PM #65582 返信
  
  名無しさん
  
  「Anybody using open-source LLMs (DeepSeek / LLaMA) in production?」というスレッドを見かけました。コメントはまだ0件ですが、オープンLLMの本番運用について話題になっています。DeepSeekやLLaMAを実際に業務で使っている方はいますか？コスト、精度、プライバシー面でのメリット・デメリット、コード生成やなど具体的なユースケースを教えてください。
- 2025年7月13日 5:16 PM #65583 返信
  
  名無しさん
  
  社内のチャットボットにLlama 3.1 70B使ってるよ。やっぱりコード生成は精度高いわ。
  - 2025年7月13日 5:19 PM #65584 返信
    
    名無しさん
    
    70BってVRAMどれくらい必要なの？
    - 2025年7月13日 5:23 PM #65585 返信
      
      名無しさん
      
      量子化すれば24GBでも動くよ。でも80GB以上推奨。
- 2025年7月13日 5:30 PM #65586 返信
  
  名無しさん
  
  DeepSeek R1は数学系の推論が強いらしいね。試した人いる？
  - 2025年7月13日 5:32 PM #65587 返信
    
    名無しさん
    
    うちの研究チームで使ってるけど、証明問題とか結構すごい。でも日本語はLLaMAのほうが自然かも。
- 2025年7月13日 5:36 PM #65588 返信
  
  名無しさん
  
  プライバシーが理由でオープン切り替えた。コスト面でもAPIより安い。ただし初期構築が面倒。
  - 2025年7月13日 5:42 PM #65589 返信
    
    名無しさん
    
    どのくらいのユーザー数まで耐えられる？スケールさせるのが心配。
    - 2025年7月13日 5:51 PM #65590 返信
      
      名無しさん
      
      小さなチームならvLLMとか使えば十分じゃない？ APIに課金する方が高いし。
- 2025年7月13日 5:52 PM #65591 返信
  
  名無しさん
  
  コード生成に使ってるけど、GPT-4と比べるとたまに変なコード吐く。でも微調整で改善できる。
  - 2025年7月13日 5:55 PM #65592 返信
    
    名無しさん
    
    微調整ってどのくらいのデータ必要？数千件で十分？
    - 2025年7月13日 5:59 PM #65593 返信
      
      名無しさん
      
      タスクによるけど、500件くらいでも効果感じるよ。LoRAがおすすめ。
- 2025年7月13日 6:05 PM #65594 返信
  
  名無しさん
  
  結局、GPT-4oのほうが楽って結論になりがち。社内政治もあって。
  - 2025年7月13日 6:17 PM #65595 返信
    
    名無しさん
    
    楽さで言えば確かに。でもコストが桁違いだから、ちゃんと比較すべき。
- 2025年7月13日 6:19 PM #65596 返信
  
  名無しさん
  
  DeepSeekって中国製だからセキュリティ的に大丈夫？
  - 2025年7月13日 6:22 PM #65597 返信
    
    名無しさん
    
    オープンなら自分で検証できるし、ローカルで動かせば問題ないでしょ。
    - 2025年7月13日 6:26 PM #65598 返信
      
      名無しさん
      
      それでも国家バックドアのリスクを気にする人もいるよね。でもLlamaもMetaだし結局どっちも。
- 2025年7月13日 6:34 PM #65599 返信
  
  名無しさん
  
  本番で使うならレイテンシが気になる。APIより遅いこと多い。
  - 2025年7月13日 6:36 PM #65600 返信
    
    名無しさん
    
    GPU積まないと厳しいよね。H100とか必要。
    - 2025年7月13日 6:40 PM #65601 返信
      
      名無しさん
      
      クラウドのGPUインスタンス使えば初期投資抑えられるけど、ランニングコスト考えると微妙。
- 2025年7月13日 6:45 PM #65602 返信
  
  名無しさん
  
  小規模なら7Bや8Bで十分って話もあるよね。用途次第。
  - 2025年7月13日 6:55 PM #65603 返信
    
    名無しさん
    
    簡単なQAなら3Bでも意外と使えるよ。チューニング次第。
- 2025年7月13日 6:57 PM #65604 返信
  
  名無しさん
  
  最近Mistralとかも出てきて選択肢増えたね。
  - 2025年7月13日 7:00 PM #65605 返信
    
    名無しさん
    
    Mistral Small 3.1は日本語微妙って聞いたけど。
    - 2025年7月13日 7:04 PM #65606 返信
      
      名無しさん
      
      実際に試してみないとわからないよね。ベンチマークだけじゃ測れない。
- 2025年7月13日 7:11 PM #65607 返信
  
  名無しさん
  
  長文要約に使いたいんだけど、open-source LLMだとコンテキスト長が短くて困る。
  - 2025年7月13日 7:23 PM #65608 返信
    
    名無しさん
    
    YaRNとか拡張手法使えば大丈夫だよ。128Kとかいける。
    - 2025年7月13日 7:24 PM #65609 返信
      
      名無しさん
      
      でもそうすると品質落ちることもあるから注意。
投稿者

投稿

27件の返信を表示中（うち親返信10件）

返信先: DeepSeekやLLaMAなどのオープンLLMを本番環境で使ってる人いますか？で#65599に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック