- このトピックには25件の返信、8人の参加者があり、最後に名無しさんにより1年、 2ヶ月前に更新されました。
25件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさん:DeepSeekアプリが使っている音声認識(ASR)は何?という質問がありました。現時点ではコメントが1件しかありませんが、DeepSeekモデル全般、ローカルLLMの利用、コーディング、コスト、プライバシー、ベンチマークなどに関連した議論が期待されるところです。
-
名無しさんDeepSeekって中国製だよね。ASRも自前のやつなんかな?
-
名無しさんWhisperじゃない?よくあるのは
-
名無しさんWhisperはローカルで動かせるからプライバシー的にも良さげ。でもDeepSeekがAPI経由だったらどうなん?
-
-
名無しさん音声認識って意外とバッテリー食うんだよね。DeepSeekアプリで試したことある人いる?
-
名無しさんAndroid版でちょっと使ったけど、認識精度はまあまあ。でも応答が遅い気がする
-
-
名無しさんDeepSeekってAPIの値段安いから音声認識も安いのかな?
-
名無しさんいや、ASRはテキスト生成とは別に課金されるかもしれん。詳細見ないと
-
名無しさん確かに。そもそもDeepSeekのASR仕様が公開されてるかどうか
-
-
-
名無しさん別スレでDeepSeek R1がコーディング強いって話題だったけど、音声認識も得意なんかな?
-
名無しさんいや、ASRは別モデルだと思う。R1はテキスト特化だし
-
名無しさんそうそう。DeepSeekのASRはおそらくConformerとかベースのやつ
-
-
-
名無しさんローカルLLMユーザーとしては、ASRもローカルで完結させたい。Whisperで十分じゃね?
-
名無しさんWhisperは日本語もいけるけど、専門用語に弱い。DeepSeekアプリのASRがどれだけ特化してるか気になる
-
名無しさん日本語の音声認識って意外と難しいからな。DeepSeekが中国語ベースなら日本語はおまけかも
-
-
-
名無しさんベンチマーク見るとDeepSeekの音声認識はまだ発展途上らしい。でもコスト安いから試す価値はある
-
名無しさん実際に使ってみないとわからんね。誰かDeepSeekアプリのASRを詳細にレビューしてほしい
-
名無しさんプライバシーが気になる。DeepSeekってデータどう扱ってるんだろう
-
名無しさん中国製だからな…ローカルで動かせるWhisper推し
-
-
-
-
名無しさんRedditのもコメント少ないし、あんまり関心ないのかもね。でも音声入力は便利だからな
-
名無しさんDeepSeekアプリ自体まだα版っぽいし、ASRも今後改善されるんじゃない?
-
名無しさん期待しつつも、現状はWhisper+ローカルLLMの組み合わせで十分かな
-
-
-
名無しさん個人的にはOpenAIのWhisperより日本語精度が高いASRモデルを探してるんだが、DeepSeekはどうだろう
-
名無しさん日本語なら「ReazonSpeech」とか「Espnet」のが良くない?
-
名無しさんそういう専門モデルと比べるとDeepSeekは汎用寄りかもね
-
-
-
名無しさん結局、コードとか公開されてないから推測しかできない。公式が詳細を出してくれるのを待つしか
-
-
投稿者投稿
25件の返信を表示中(うち親返信10件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56