数式PDF向けOCR：FireRed-OCR vs DeepSeek-OCR vs MonkeyOCR どれがいい？

このトピックには20件の返信、6人の参加者があり、最後に名無しさんにより7ヶ月、 3週前に更新されました。

20件の返信を表示中（うち親返信10件）

投稿者

投稿
- 2025年11月4日 1:45 PM #66503 返信
  
  名無しさん
  
  Redditのr/LocalLLaMAで、AI論文のような数式が多いPDFをOCRするツールについて議論がありました。比較対象はFireRed-OCR、DeepSeek-OCR、MonkeyOCR。スレ主は数式の認識精度やローカル運用の可否を気にしていて、コメントではDeepSeek-OCRが良いという意見や、FireRed-OCRの方が数式に強いという声がありました。
- 2025年11月4日 1:47 PM #66504 返信
  
  名無しさん
  
  俺はDeepSeek-OCR使ってるけど、数式はまあまあ正確だよ。ただ分数とか複雑なのはたまにミスる。
  - 2025年11月4日 1:50 PM #66505 返信
    
    名無しさん
    
    FireRed-OCRの方が数式認識は上って聞いたが、試した人いる？
- 2025年11月4日 1:54 PM #66506 返信
  
  名無しさん
  
  MonkeyOCRは中国語論文向けで、英語はイマイチらしい。
  - 2025年11月4日 2:01 PM #66507 返信
    
    名無しさん
    
    やっぱりローカルで動かせるのが重要だよな。DeepSeek-OCRはローカル動作できるから助かる。
- 2025年11月4日 2:03 PM #66508 返信
  
  名無しさん
  
  どのモデルもGPU必須？CPUだけだと遅すぎる？
  - 2025年11月4日 2:07 PM #66509 返信
    
    名無しさん
    
    DeepSeek-OCRはCPUでもなんとか動くけど、数ページで数分かかるから実用的じゃない。
- 2025年11月4日 2:13 PM #66510 返信
  
  名無しさん
  
  数式OCRならMathPixみたいな商用サービスのが正確だけど、値段がね…
  - 2025年11月4日 2:22 PM #66511 返信
    
    名無しさん
    
    オープン数式まで完璧なのはまだないよな。それぞれ一長一短。
- 2025年11月4日 2:23 PM #66512 返信
  
  名無しさん
  
  論文読むだけなら、OCRより直接LaTeX探した方が早い気がする。
  - 2025年11月4日 2:26 PM #66513 返信
    
    名無しさん
    
    でも古い論文とかはOCR必須だよ。特にスキャンPDF。
- 2025年11月4日 2:30 PM #66514 返信
  
  名無しさん
  
  FireRed-OCRってモデルデカすぎてVRAM足りんわ。8GBじゃ無理。
  - 2025年11月4日 2:36 PM #66515 返信
    
    名無しさん
    
    量子化版がでればいいのに。
- 2025年11月4日 2:48 PM #66516 返信
  
  名無しさん
  
  DeepSeek-OCRはOllamaで手軽に試せるのがいい。
  - 2025年11月4日 2:50 PM #66517 返信
    
    名無しさん
    
    今はそれで十分だわ。精度は誤読あっても文脈で直せる。
- 2025年11月4日 2:52 PM #66518 返信
  
  名無しさん
  
  そもそもOCRじゃなくて、マークダウン変換ツールみたいなのが欲しい。
  - 2025年11月4日 2:57 PM #66519 返信
    
    名無しさん
    
    Pandoc+MathJaxとかあるけど、入力が厄介。
- 2025年11月4日 3:05 PM #66520 返信
  
  名無しさん
  
  自分はGoogle DriveのOCR使ってるけど、数式は壊滅的。
  - 2025年11月4日 3:07 PM #66521 返信
    
    名無しさん
    
    あれは日本語論文ならまだマシだけど、英語数式はダメだな。
- 2025年11月4日 3:11 PM #66522 返信
  
  名無しさん
  
  結局全部試すのが一番だけど、時間かかるよね。
  - 2025年11月4日 3:16 PM #66523 返信
    
    名無しさん
    
    このスレのRedditではDeepSeek推し多かったけど、数式重視ならFireRedって声もあった。用途次第。
投稿者

投稿

20件の返信を表示中（うち親返信10件）

返信先: 数式PDF向けOCR：FireRed-OCR vs DeepSeek-OCR vs MonkeyOCR どれがいい？で#66505に返信

あなたの情報:

お名前 (必須)

メール (非公開) (必須):

ウェブサイト:

キャンセル

関連するAIトピック