数式PDF向けOCR:FireRed-OCR vs DeepSeek-OCR vs MonkeyOCR どれがいい?

掲示板 フォーラム AI 数式PDF向けOCR:FireRed-OCR vs DeepSeek-OCR vs MonkeyOCR どれがいい?

  • このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。
20件の返信を表示中(うち親返信10件)
  • 投稿者
    投稿
    • #66503 返信
      名無しさん
      Redditのr/LocalLLaMAで、AI論文のような数式が多いPDFをOCRするツールについて議論がありました。比較対象はFireRed-OCR、DeepSeek-OCR、MonkeyOCR。スレ主は数式の認識精度やローカル運用の可否を気にしていて、コメントではDeepSeek-OCRが良いという意見や、FireRed-OCRの方が数式に強いという声がありました。

    • #66504 返信
      名無しさん
      俺はDeepSeek-OCR使ってるけど、数式はまあまあ正確だよ。ただ分数とか複雑なのはたまにミスる。

      • #66505 返信
        名無しさん
        FireRed-OCRの方が数式認識は上って聞いたが、試した人いる?

    • #66506 返信
      名無しさん
      MonkeyOCRは中国語論文向けで、英語はイマイチらしい。

      • #66507 返信
        名無しさん
        やっぱりローカルで動かせるのが重要だよな。DeepSeek-OCRはローカル動作できるから助かる。

    • #66508 返信
      名無しさん
      どのモデルもGPU必須?CPUだけだと遅すぎる?

      • #66509 返信
        名無しさん
        DeepSeek-OCRはCPUでもなんとか動くけど、数ページで数分かかるから実用的じゃない。

    • #66510 返信
      名無しさん
      数式OCRならMathPixみたいな商用サービスのが正確だけど、値段がね…

      • #66511 返信
        名無しさん
        オープン数式まで完璧なのはまだないよな。それぞれ一長一短。

    • #66512 返信
      名無しさん
      論文読むだけなら、OCRより直接LaTeX探した方が早い気がする。

      • #66513 返信
        名無しさん
        でも古い論文とかはOCR必須だよ。特にスキャンPDF。

    • #66514 返信
      名無しさん
      FireRed-OCRってモデルデカすぎてVRAM足りんわ。8GBじゃ無理。

      • #66515 返信
        名無しさん
        量子化版がでればいいのに。

    • #66516 返信
      名無しさん
      DeepSeek-OCRはOllamaで手軽に試せるのがいい。

      • #66517 返信
        名無しさん
        今はそれで十分だわ。精度は誤読あっても文脈で直せる。

    • #66518 返信
      名無しさん
      そもそもOCRじゃなくて、マークダウン変換ツールみたいなのが欲しい。

      • #66519 返信
        名無しさん
        Pandoc+MathJaxとかあるけど、入力が厄介。

    • #66520 返信
      名無しさん
      自分はGoogle DriveのOCR使ってるけど、数式は壊滅的。

      • #66521 返信
        名無しさん
        あれは日本語論文ならまだマシだけど、英語数式はダメだな。

    • #66522 返信
      名無しさん
      結局全部試すのが一番だけど、時間かかるよね。

      • #66523 返信
        名無しさん
        このスレのRedditではDeepSeek推し多かったけど、数式重視ならFireRedって声もあった。用途次第。

20件の返信を表示中(うち親返信10件)
返信先: 数式PDF向けOCR:FireRed-OCR vs DeepSeek-OCR vs MonkeyOCR どれがいい?で#66505に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました