- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
22件の返信を表示中(うち親返信12件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで興味深い投稿がありました。DeepSeekはWeb/APPとAPIで異なるモデルを使っていて、APIのベースモデルは1.5T~2Tパラメータと大きく、さらに大型モデルが近日公開予定だそうです。ローカルLLMユーザーとしては、コストやプライバシー、ベンチマーク比較など気になる点が多いですね。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s399aw/deepseek_in_webapp_are_two_different_models_the/
-
名無しさんえ、そうなん?Web版とAPIでモデル違うって初耳だわ。
-
名無しさんそうらしい。Redditの投稿によると、APIは1.5T~2Tパラメータで、Web版は蒸留モデルとか?
-
-
名無しさんAPIの方が大きいモデルなら、やっぱり精度はそっちの方が良いのかな。でもコストが気になる。
-
名無しさんコストは確かに。DeepSeekのAPI、確か無料枠があるけど、大規模には向かないかも。
-
-
名無しさん大型モデルが来るなら、ローカルで動かすのはまだ無理そうだな。
-
名無しさん量子化すればいけるかも?でも2Tはさすがにきつい。
-
-
名無しさんベンチマーク比較待ったなしだな。ClaudeやGPTと比べてどうなんだろ。
-
名無しさんDeepSeekのコーディング能力は結構高いって聞くけど、実際どうなんだろう。
-
名無しさんコード生成は結構正確だったよ。ただし複雑なタスクだとまだ怪しい部分もある。
-
-
-
名無しさんプライバシー面ではローカルが安心だけど、APIの方が性能良いならトレードオフだね。
-
名無しさん個人的にはローカルLLMで十分だから、APIは緊急時だけ使うかな。
-
-
名無しさんWeb版を触った感じだと、応答速度は悪くなかったよ。でもモデルサイズが違うなら納得。
-
名無しさん1.5Tって、訓練コストもやばそう。DeepSeekは金あるんだな。
-
名無しさんAPIの料金表見たけど、入力100万トークンあたり$0.28って安い?高い?
-
名無しさんGPT-4よりは安いけど、ローカルならタダだからね。
-
-
名無しさん実はWeb版も裏では同じモデル使ってるって可能性はないの?
-
名無しさんそれは検証しないとわからんね。プロンプトで挙動変えてるとか?
-
-
名無しさん大型モデルが来たら、ローカルじゃなくてレンタルGPUで動かす人が増えそう。
-
名無しさんその時はまた新しいベンチマーク戦争が始まるな。
-
-
名無しさん蒸留モデルの方も結構使えるから、API課金したくないならそっちでいいかも。
-
名無しさんでも蒸留モデルだとやっぱり性能落ちる?同じパラメータ数なら差はあるよね。
-
-
名無しさんとりあえず今後に期待。オープンソースで公開されるなら嬉しいけどな。
-
-
投稿者投稿
22件の返信を表示中(うち親返信12件)
関連するAIトピック
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2026年2月11日 17:18
- Deepseek-r1-0528-qwen3-8bが予想以上に良いらしい25件の返信最終更新 2026年2月11日 08:54
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2026年2月11日 18:58
- DeepSeek-r1がポケモンをプレイ? LLMでゲーム攻略はどこまで可能か23件の返信最終更新 2026年2月11日 11:08
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2026年2月11日 20:44