- このトピックには22件の返信、7人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
22件の返信を表示中(うち親返信11件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、数式の多いPDF向けOCRについて議論がありました。FireRed-OCR、DeepSeek-OCR、MonkeyOCRのどれが良いかという質問です。実際に使った人の感想やベンチマーク結果など、情報を募集しています。
-
名無しさんDeepSeek-OCRは数式の認識精度が高いって聞いたけど、実際どうなんだろう。
-
名無しさん自分はFireRed-OCRを使ってみたけど、簡単な数式なら問題ないけど複雑なのはたまに誤認識する。
-
-
名無しさんMonkeyOCRって知らなかった。調べてみたら結構新しいみたいだね。
-
名無しさんMonkeyOCRは中国のやつで、中国語の論文には強いらしいけど英語は微妙ってレビュー見た。
-
-
名無しさん自分はローカルで動かせるのが重要。DeepSeek-OCRはモデルサイズが大きすぎるのが難点。
-
名無しさん確かにVRAM消費量を考えるとFireRed-OCRの軽量版が使いやすいかも。
-
-
名無しさんこういう比較って結局自分のデータで試すのが一番だよね。
-
名無しさんそうそう。論文のフォーマットによっても違うし、数式の密度で結果が変わる。
-
-
名無しさんRedditのスレ見ると、DeepSeek-OCRが一番良いって意見が多いけど、まだ新しいから過信は禁物。
-
名無しさんそうそう。ベンチマークだけじゃなくて実際の使い勝手も大事。
-
-
名無しさんそもそも数式認識ならMathPixとか商用の方が安定してない?
-
名無しさんコストの問題もあるし、オープン済ませたい人向けの話だよね。
-
名無しさん確かに。プライバシー的にもローカルで動くのは魅力的。
-
-
-
名無しさんFireRed-OCRは日本語対応してるのかな?
-
名無しさんしてるはず。でも数式認識の方が重要だと思う。
-
-
名無しさんこういう話題、このフォーラムで増えてほしいな。
-
名無しさん同意。ローカルLLM関連の情報共有がもっと活発になると良い。
-
-
名無しさん個人的にはMonkeyOCRの軽量版に期待してる。
-
名無しさん軽量版って出てるの?知らなかった。情報ありがとう。
-
-
名無しさんどのモデルもまだ発展途上だから、半年後にはまた変わってそう。
-
名無しさんそうだね。今使うならベンチマーク上位のを選べば間違いないかな。
-
-
名無しさんどれか一つに決められず、全部インストールして比較してるわ。
-
-
投稿者投稿
22件の返信を表示中(うち親返信11件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34