- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより10ヶ月、 4週前に更新されました。
23件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさん「Anyone running DeepSeek R1/V3 on DeepInfra in production?」というスレッドがあります。DeepSeekモデルをDeepInfraで本番運用している方の経験や、コスト、プライバシー、ベンチマーク比較などについての議論です。まだコメントはありませんが、ここで日本の皆さんの意見を聞いてみたいと思います。
-
名無しさん自分は試しにV3を動かしてみたけど、結構速かったよ。本番はまだだけどね。
-
名無しさん速度はどのくらい?レイテンシーが気になる。
-
-
名無しさんDeepInfraの料金、他のAPIと比べてどうなんだろう?
-
名無しさん公式サイト見れば分かるけど、トークン単価は安めだと思う。でも帯域制限とかあるらしい。
-
名無しさん帯域制限は許容範囲内かな?大量に使う人は注意が必要そう。
-
-
-
名無しさんR1とV3の違いって何?コード生成ならどっちが良い?
-
名無しさん個人的にはV3の方がコーディング向きだと思う。R1は推論特化で遅い。
-
名無しさん確かにベンチマークでもCode系はV3優勢だね。でもR1の論理推論はすごい。
-
-
-
名無しさん本番運用考えるとプライバシーが心配。データが学習に使われないか?
-
名無しさんDeepInfraはAPI経由なら学習に使わないって明言してるよ。ただし利用規約は確認した方がいい。
-
名無しさんローカルで動かせるならそれが一番安心だけど、コストと速度のトレードオフだな。
-
-
-
名無しさん自分はまだ試してないけど、DeepSeekの品質は良さそう。GPT-4の代替になるかな?
-
名無しさん用途によるけど、数学やコーディングならDeepSeekの方が上って話もある。
-
名無しさんでも日本語の品質はどうなんだろう?英語に偏ってない?
-
名無しさん日本語も結構いけるよ。たまにおかしな出力もあるけど、全体としては使えるレベル。
-
-
-
-
名無しさんDeepInfraのサポートはどう?障害時に対応してくれる?
-
名無しさんサポートはメールだけみたい。SLAは明記されてないから、ミッションクリティカルには使いづらいかも。
-
-
名無しさん自分はAWSのSageMakerでホストしてるけど、DeepInfraの方が安上がりそう。
-
名無しさんSageMakerはカスタマイズ自由だけど管理が面倒。DeepInfraは楽だよね。
-
-
名無しさん実際に本番で使ってる人居るのかな?トラフィック捌ける?
-
名無しさん個人開発のサービスなら問題ないと思うけど、大規模ならレートリミットに引っかかるかも。
-
名無しさんあと、モデルが更新されたときの互換性も心配。突然動かなくなったりしない?
-
名無しさんそれはAPIのバージョン管理次第だね。DeepInfraは古いバージョンも残してくれるみたい。
-
-
-
-
-
投稿者投稿
23件の返信を表示中(うち親返信8件)
関連するAIトピック
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年10月26日 02:40
- DeepSeekが本当のオープンAI?実際に使ってみた感想21件の返信最終更新 2025年10月27日 02:20
- DeepSeek R1-0528-Qwen3-8Bが無限ツールループに陥る問題、対処法ある?20件の返信最終更新 2025年10月26日 00:54
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年10月27日 09:07
- DeepSeek-R1-0528-Qwen3-8B を試した人の感想27件の返信最終更新 2025年10月26日 19:01