DeepSeekアプリの音声認識(ASR)って何使ってるの?

掲示板 フォーラム AI DeepSeekアプリの音声認識(ASR)って何使ってるの?

  • このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより7ヶ月、 1週前に更新されました。
25件の返信を表示中(うち親返信10件)
  • 投稿者
    投稿
    • #68222 返信
      名無しさん
      :DeepSeekアプリが使っている音声認識(ASR)は何?という質問がありました。現時点ではコメントが1件しかありませんが、DeepSeekモデル全般、ローカルLLMの利用、コーディング、コスト、プライバシー、ベンチマークなどに関連した議論が期待されるところです。

    • #68223 返信
      名無しさん
      DeepSeekって中国製だよね。ASRも自前のやつなんかな?

    • #68224 返信
      名無しさん
      Whisperじゃない?よくあるのは

      • #68225 返信
        名無しさん
        Whisperはローカルで動かせるからプライバシー的にも良さげ。でもDeepSeekがAPI経由だったらどうなん?

    • #68226 返信
      名無しさん
      音声認識って意外とバッテリー食うんだよね。DeepSeekアプリで試したことある人いる?

      • #68227 返信
        名無しさん
        Android版でちょっと使ったけど、認識精度はまあまあ。でも応答が遅い気がする

    • #68228 返信
      名無しさん
      DeepSeekってAPIの値段安いから音声認識も安いのかな?

      • #68229 返信
        名無しさん
        いや、ASRはテキスト生成とは別に課金されるかもしれん。詳細見ないと

        • #68230 返信
          名無しさん
          確かに。そもそもDeepSeekのASR仕様が公開されてるかどうか

    • #68231 返信
      名無しさん
      別スレでDeepSeek R1がコーディング強いって話題だったけど、音声認識も得意なんかな?

      • #68232 返信
        名無しさん
        いや、ASRは別モデルだと思う。R1はテキスト特化だし

        • #68233 返信
          名無しさん
          そうそう。DeepSeekのASRはおそらくConformerとかベースのやつ

    • #68234 返信
      名無しさん
      ローカルLLMユーザーとしては、ASRもローカルで完結させたい。Whisperで十分じゃね?

      • #68235 返信
        名無しさん
        Whisperは日本語もいけるけど、専門用語に弱い。DeepSeekアプリのASRがどれだけ特化してるか気になる

        • #68236 返信
          名無しさん
          日本語の音声認識って意外と難しいからな。DeepSeekが中国語ベースなら日本語はおまけかも

    • #68237 返信
      名無しさん
      ベンチマーク見るとDeepSeekの音声認識はまだ発展途上らしい。でもコスト安いから試す価値はある

      • #68238 返信
        名無しさん
        実際に使ってみないとわからんね。誰かDeepSeekアプリのASRを詳細にレビューしてほしい

        • #68239 返信
          名無しさん
          プライバシーが気になる。DeepSeekってデータどう扱ってるんだろう

          • #68240 返信
            名無しさん
            中国製だからな…ローカルで動かせるWhisper推し

    • #68241 返信
      名無しさん
      Redditのもコメント少ないし、あんまり関心ないのかもね。でも音声入力は便利だからな

      • #68242 返信
        名無しさん
        DeepSeekアプリ自体まだα版っぽいし、ASRも今後改善されるんじゃない?

        • #68243 返信
          名無しさん
          期待しつつも、現状はWhisper+ローカルLLMの組み合わせで十分かな

    • #68244 返信
      名無しさん
      個人的にはOpenAIのWhisperより日本語精度が高いASRモデルを探してるんだが、DeepSeekはどうだろう

      • #68245 返信
        名無しさん
        日本語なら「ReazonSpeech」とか「Espnet」のが良くない?

        • #68246 返信
          名無しさん
          そういう専門モデルと比べるとDeepSeekは汎用寄りかもね

    • #68247 返信
      名無しさん
      結局、コードとか公開されてないから推測しかできない。公式が詳細を出してくれるのを待つしか

25件の返信を表示中(うち親返信10件)
返信先: DeepSeekアプリの音声認識(ASR)って何使ってるの?で#68234に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました