- このトピックには23件の返信、7人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
23件の返信を表示中(うち親返信8件)
-
投稿者投稿
-
-
名無しさん「Anyone running DeepSeek R1/V3 on DeepInfra in production?」というスレッドがあります。DeepSeekモデルをDeepInfraで本番運用している方の経験や、コスト、プライバシー、ベンチマーク比較などについての議論です。まだコメントはありませんが、ここで日本の皆さんの意見を聞いてみたいと思います。
-
名無しさん自分は試しにV3を動かしてみたけど、結構速かったよ。本番はまだだけどね。
-
名無しさん速度はどのくらい?レイテンシーが気になる。
-
-
名無しさんDeepInfraの料金、他のAPIと比べてどうなんだろう?
-
名無しさん公式サイト見れば分かるけど、トークン単価は安めだと思う。でも帯域制限とかあるらしい。
-
名無しさん帯域制限は許容範囲内かな?大量に使う人は注意が必要そう。
-
-
-
名無しさんR1とV3の違いって何?コード生成ならどっちが良い?
-
名無しさん個人的にはV3の方がコーディング向きだと思う。R1は推論特化で遅い。
-
名無しさん確かにベンチマークでもCode系はV3優勢だね。でもR1の論理推論はすごい。
-
-
-
名無しさん本番運用考えるとプライバシーが心配。データが学習に使われないか?
-
名無しさんDeepInfraはAPI経由なら学習に使わないって明言してるよ。ただし利用規約は確認した方がいい。
-
名無しさんローカルで動かせるならそれが一番安心だけど、コストと速度のトレードオフだな。
-
-
-
名無しさん自分はまだ試してないけど、DeepSeekの品質は良さそう。GPT-4の代替になるかな?
-
名無しさん用途によるけど、数学やコーディングならDeepSeekの方が上って話もある。
-
名無しさんでも日本語の品質はどうなんだろう?英語に偏ってない?
-
名無しさん日本語も結構いけるよ。たまにおかしな出力もあるけど、全体としては使えるレベル。
-
-
-
-
名無しさんDeepInfraのサポートはどう?障害時に対応してくれる?
-
名無しさんサポートはメールだけみたい。SLAは明記されてないから、ミッションクリティカルには使いづらいかも。
-
-
名無しさん自分はAWSのSageMakerでホストしてるけど、DeepInfraの方が安上がりそう。
-
名無しさんSageMakerはカスタマイズ自由だけど管理が面倒。DeepInfraは楽だよね。
-
-
名無しさん実際に本番で使ってる人居るのかな?トラフィック捌ける?
-
名無しさん個人開発のサービスなら問題ないと思うけど、大規模ならレートリミットに引っかかるかも。
-
名無しさんあと、モデルが更新されたときの互換性も心配。突然動かなくなったりしない?
-
名無しさんそれはAPIのバージョン管理次第だね。DeepInfraは古いバージョンも残してくれるみたい。
-
-
-
-
-
投稿者投稿
23件の返信を表示中(うち親返信8件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56