- このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 1ヶ月前に更新されました。
13件の返信を表示中(うち親返信6件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで話題になっているDeepSeekの新OCRモデル「DeepSeek OCR」についてのスレッドです。
精度が高く、特に日本語を含むアジア言語の認識に強いとの報告が多く、ローカル実行できる点が評価されています。一方で、学習に使われたデータの透明性や、商用利用のライセンスについては議論が分かれています。また、APIの価格設定が高めで、個人利用には少し敷居が高いという声もあります。皆さんの意見をお聞かせください。 -
名無しさんこれすごいね。試してみたけど、手書きの日本語でも結構正確に読んでくれた。
-
名無しさん手書き認識できるのはデカい。GoogleのOCRより上じゃない?
-
-
名無しさんAPIの価格が高すぎる。1ページあたりいくらだよ。ローカルで動かせるのが唯一の救い。
-
名無しさん確かに高いけど、品質考えたら妥当かもしれん。ただ、個人じゃ使い続けられないな。
-
-
名無しさんライセンス周りがちょっと不安。DeepSeekって中国の会社だし、データの扱いが心配。
-
名無しさんそこはローカル実行すれば問題ないんじゃない?でも学習データが気になるのはわかる。
-
-
名無しさんベンチマーク結果見たけど、Llama系のOCRより圧倒的に良かった。特に中国語と日本語で差が出てた。
-
名無しさんそれはアジア言語に特化してるからじゃない?英語だけなら他でもいいかも。
-
名無しさんいや、英語もかなり精度良かったよ。全体的に高水準。
-
-
-
名無しさんこれを使ってRAGの前処理を自動化したいんだけど、誰か試した人いる?
-
名無しさんやってみたけど、結構パラメータ調整が必要。デフォルトだと傾き補正が弱い。
-
名無しさんなるほど、参考になる。自分も試してみるわ。
-
-
-
名無しさんオープンこれだけの精度はすごい。ただ、コミュニティの活動がまだ少ないから今後に期待。
-
-
投稿者投稿
13件の返信を表示中(うち親返信6件)
関連するAIトピック
- Qwenが32B/235Bベースモデルを非公開に、DeepSeekへの蒸留対策か?15件の返信最終更新 2025年6月26日 17:23
- DeepSeek-R1-0528-Qwen3-8BのOpenVINO量子化バージョンが公開されたらしい19件の返信最終更新 2025年6月26日 13:56
- DeepSeek-R1-Qwen3-8bのトークナイザーをQwen3 30b A3bにコピーできる?17件の返信最終更新 2025年6月26日 15:37
- DeepSeek R1-0528のシステムプロンプトがリークされたらしい16件の返信最終更新 2025年6月25日 12:50
- AIと人間の見分けがつくか? – DeepSeek新バージョンを追加したゲームの話題18件の返信最終更新 2025年6月25日 10:56