- このトピックには27件の返信、9人の参加者があり、最後に名無しさんにより11ヶ月、 2週前に更新されました。
27件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさん「Anybody using open-source LLMs (DeepSeek / LLaMA) in production?」というスレッドを見かけました。コメントはまだ0件ですが、オープンLLMの本番運用について話題になっています。DeepSeekやLLaMAを実際に業務で使っている方はいますか?コスト、精度、プライバシー面でのメリット・デメリット、コード生成やなど具体的なユースケースを教えてください。
-
名無しさん社内のチャットボットにLlama 3.1 70B使ってるよ。やっぱりコード生成は精度高いわ。
-
名無しさん70BってVRAMどれくらい必要なの?
-
名無しさん量子化すれば24GBでも動くよ。でも80GB以上推奨。
-
-
-
名無しさんDeepSeek R1は数学系の推論が強いらしいね。試した人いる?
-
名無しさんうちの研究チームで使ってるけど、証明問題とか結構すごい。でも日本語はLLaMAのほうが自然かも。
-
-
名無しさんプライバシーが理由でオープン切り替えた。コスト面でもAPIより安い。ただし初期構築が面倒。
-
名無しさんどのくらいのユーザー数まで耐えられる?スケールさせるのが心配。
-
名無しさん小さなチームならvLLMとか使えば十分じゃない? APIに課金する方が高いし。
-
-
-
名無しさんコード生成に使ってるけど、GPT-4と比べるとたまに変なコード吐く。でも微調整で改善できる。
-
名無しさん微調整ってどのくらいのデータ必要?数千件で十分?
-
名無しさんタスクによるけど、500件くらいでも効果感じるよ。LoRAがおすすめ。
-
-
-
名無しさん結局、GPT-4oのほうが楽って結論になりがち。社内政治もあって。
-
名無しさん楽さで言えば確かに。でもコストが桁違いだから、ちゃんと比較すべき。
-
-
名無しさんDeepSeekって中国製だからセキュリティ的に大丈夫?
-
名無しさんオープンなら自分で検証できるし、ローカルで動かせば問題ないでしょ。
-
名無しさんそれでも国家バックドアのリスクを気にする人もいるよね。でもLlamaもMetaだし結局どっちも。
-
-
-
名無しさん本番で使うならレイテンシが気になる。APIより遅いこと多い。
-
名無しさんGPU積まないと厳しいよね。H100とか必要。
-
名無しさんクラウドのGPUインスタンス使えば初期投資抑えられるけど、ランニングコスト考えると微妙。
-
-
-
名無しさん小規模なら7Bや8Bで十分って話もあるよね。用途次第。
-
名無しさん簡単なQAなら3Bでも意外と使えるよ。チューニング次第。
-
-
名無しさん最近Mistralとかも出てきて選択肢増えたね。
-
名無しさんMistral Small 3.1は日本語微妙って聞いたけど。
-
名無しさん実際に試してみないとわからないよね。ベンチマークだけじゃ測れない。
-
-
-
名無しさん長文要約に使いたいんだけど、open-source LLMだとコンテキスト長が短くて困る。
-
名無しさんYaRNとか拡張手法使えば大丈夫だよ。128Kとかいける。
-
名無しさんでもそうすると品質落ちることもあるから注意。
-
-
-
-
投稿者投稿
27件の返信を表示中(うち親返信10件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01