- このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
20件の返信を表示中(うち親返信10件)
-
投稿者投稿
-
-
名無しさんRedditのr/LocalLLaMAで、AI論文のような数式が多いPDFをOCRするツールについて議論がありました。比較対象はFireRed-OCR、DeepSeek-OCR、MonkeyOCR。スレ主は数式の認識精度やローカル運用の可否を気にしていて、コメントではDeepSeek-OCRが良いという意見や、FireRed-OCRの方が数式に強いという声がありました。
-
名無しさん俺はDeepSeek-OCR使ってるけど、数式はまあまあ正確だよ。ただ分数とか複雑なのはたまにミスる。
-
名無しさんFireRed-OCRの方が数式認識は上って聞いたが、試した人いる?
-
-
名無しさんMonkeyOCRは中国語論文向けで、英語はイマイチらしい。
-
名無しさんやっぱりローカルで動かせるのが重要だよな。DeepSeek-OCRはローカル動作できるから助かる。
-
-
名無しさんどのモデルもGPU必須?CPUだけだと遅すぎる?
-
名無しさんDeepSeek-OCRはCPUでもなんとか動くけど、数ページで数分かかるから実用的じゃない。
-
-
名無しさん数式OCRならMathPixみたいな商用サービスのが正確だけど、値段がね…
-
名無しさんオープン数式まで完璧なのはまだないよな。それぞれ一長一短。
-
-
名無しさん論文読むだけなら、OCRより直接LaTeX探した方が早い気がする。
-
名無しさんでも古い論文とかはOCR必須だよ。特にスキャンPDF。
-
-
名無しさんFireRed-OCRってモデルデカすぎてVRAM足りんわ。8GBじゃ無理。
-
名無しさん量子化版がでればいいのに。
-
-
名無しさんDeepSeek-OCRはOllamaで手軽に試せるのがいい。
-
名無しさん今はそれで十分だわ。精度は誤読あっても文脈で直せる。
-
-
名無しさんそもそもOCRじゃなくて、マークダウン変換ツールみたいなのが欲しい。
-
名無しさんPandoc+MathJaxとかあるけど、入力が厄介。
-
-
名無しさん自分はGoogle DriveのOCR使ってるけど、数式は壊滅的。
-
名無しさんあれは日本語論文ならまだマシだけど、英語数式はダメだな。
-
-
名無しさん結局全部試すのが一番だけど、時間かかるよね。
-
名無しさんこのスレのRedditではDeepSeek推し多かったけど、数式重視ならFireRedって声もあった。用途次第。
-
-
-
投稿者投稿
20件の返信を表示中(うち親返信10件)
関連するAIトピック
- ChatGPTを使いこなすコツ・便利な使い方を共有しよう0件の返信最終更新 2025年3月16日 18:46
- 【AI】2026年の生成AI、結局どこ見れば面白い?39件の返信最終更新 2025年3月17日 16:11
- ECCV 2022のレビューについて議論しよう21件の返信最終更新 2025年4月7日 07:48
- ECCV 2022 採択論文リストが公開されましたね27件の返信最終更新 2025年4月12日 20:48
- DeepSeekの評価額450億ドル近く、中国「Big Fund」が投資交渉 – ローカルLLMへの影響は?14件の返信最終更新 2025年10月11日 08:34