DeepSeek、Web/APPとAPIでモデルが違う?ベースモデルは1.5T~2T規模らしい

掲示板 フォーラム AI DeepSeek、Web/APPとAPIでモデルが違う?ベースモデルは1.5T~2T規模らしい

  • このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 2週前に更新されました。
22件の返信を表示中(うち親返信12件)
  • 投稿者
    投稿
    • #67687 返信
      名無しさん
      Redditのr/LocalLLaMAで興味深い投稿がありました。DeepSeekはWeb/APPとAPIで異なるモデルを使っていて、APIのベースモデルは1.5T~2Tパラメータと大きく、さらに大型モデルが近日公開予定だそうです。ローカルLLMユーザーとしては、コストやプライバシー、ベンチマーク比較など気になる点が多いですね。ソース: https://www.reddit.com/r/LocalLLaMA/comments/1s399aw/deepseek_in_webapp_are_two_different_models_the/

    • #67688 返信
      名無しさん
      え、そうなん?Web版とAPIでモデル違うって初耳だわ。

      • #67690 返信
        名無しさん
        そうらしい。Redditの投稿によると、APIは1.5T~2Tパラメータで、Web版は蒸留モデルとか?

    • #67689 返信
      名無しさん
      APIの方が大きいモデルなら、やっぱり精度はそっちの方が良いのかな。でもコストが気になる。

      • #67692 返信
        名無しさん
        コストは確かに。DeepSeekのAPI、確か無料枠があるけど、大規模には向かないかも。

    • #67691 返信
      名無しさん
      大型モデルが来るなら、ローカルで動かすのはまだ無理そうだな。

      • #67694 返信
        名無しさん
        量子化すればいけるかも?でも2Tはさすがにきつい。

    • #67693 返信
      名無しさん
      ベンチマーク比較待ったなしだな。ClaudeやGPTと比べてどうなんだろ。

      • #67696 返信
        名無しさん
        DeepSeekのコーディング能力は結構高いって聞くけど、実際どうなんだろう。

        • #67700 返信
          名無しさん
          コード生成は結構正確だったよ。ただし複雑なタスクだとまだ怪しい部分もある。

    • #67695 返信
      名無しさん
      プライバシー面ではローカルが安心だけど、APIの方が性能良いならトレードオフだね。

      • #67698 返信
        名無しさん
        個人的にはローカルLLMで十分だから、APIは緊急時だけ使うかな。

    • #67697 返信
      名無しさん
      Web版を触った感じだと、応答速度は悪くなかったよ。でもモデルサイズが違うなら納得。

    • #67699 返信
      名無しさん
      1.5Tって、訓練コストもやばそう。DeepSeekは金あるんだな。

    • #67701 返信
      名無しさん
      APIの料金表見たけど、入力100万トークンあたり$0.28って安い?高い?

      • #67702 返信
        名無しさん
        GPT-4よりは安いけど、ローカルならタダだからね。

    • #67703 返信
      名無しさん
      実はWeb版も裏では同じモデル使ってるって可能性はないの?

      • #67704 返信
        名無しさん
        それは検証しないとわからんね。プロンプトで挙動変えてるとか?

    • #67705 返信
      名無しさん
      大型モデルが来たら、ローカルじゃなくてレンタルGPUで動かす人が増えそう。

      • #67706 返信
        名無しさん
        その時はまた新しいベンチマーク戦争が始まるな。

    • #67707 返信
      名無しさん
      蒸留モデルの方も結構使えるから、API課金したくないならそっちでいいかも。

      • #67708 返信
        名無しさん
        でも蒸留モデルだとやっぱり性能落ちる?同じパラメータ数なら差はあるよね。

    • #67709 返信
      名無しさん
      とりあえず今後に期待。オープンソースで公開されるなら嬉しいけどな。

22件の返信を表示中(うち親返信12件)
返信先: DeepSeek、Web/APPとAPIでモデルが違う?ベースモデルは1.5T~2T規模らしいで#67696に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました