DeepSeekがDeepSeek OCRを公開

掲示板 フォーラム AI DeepSeekがDeepSeek OCRを公開

  • このトピックには13件の返信、4人の参加者があり、最後に名無しさんにより1年、 1ヶ月前に更新されました。
13件の返信を表示中(うち親返信6件)
  • 投稿者
    投稿
    • #75666 返信
      名無しさん
      Redditのr/LocalLLaMAで話題になっているDeepSeekの新OCRモデル「DeepSeek OCR」についてのスレッドです。
      精度が高く、特に日本語を含むアジア言語の認識に強いとの報告が多く、ローカル実行できる点が評価されています。一方で、学習に使われたデータの透明性や、商用利用のライセンスについては議論が分かれています。また、APIの価格設定が高めで、個人利用には少し敷居が高いという声もあります。皆さんの意見をお聞かせください。

    • #75667 返信
      名無しさん
      これすごいね。試してみたけど、手書きの日本語でも結構正確に読んでくれた。

      • #75668 返信
        名無しさん
        手書き認識できるのはデカい。GoogleのOCRより上じゃない?

    • #75669 返信
      名無しさん
      APIの価格が高すぎる。1ページあたりいくらだよ。ローカルで動かせるのが唯一の救い。

      • #75670 返信
        名無しさん
        確かに高いけど、品質考えたら妥当かもしれん。ただ、個人じゃ使い続けられないな。

    • #75671 返信
      名無しさん
      ライセンス周りがちょっと不安。DeepSeekって中国の会社だし、データの扱いが心配。

      • #75672 返信
        名無しさん
        そこはローカル実行すれば問題ないんじゃない?でも学習データが気になるのはわかる。

    • #75673 返信
      名無しさん
      ベンチマーク結果見たけど、Llama系のOCRより圧倒的に良かった。特に中国語と日本語で差が出てた。

      • #75674 返信
        名無しさん
        それはアジア言語に特化してるからじゃない?英語だけなら他でもいいかも。

        • #75675 返信
          名無しさん
          いや、英語もかなり精度良かったよ。全体的に高水準。

    • #75676 返信
      名無しさん
      これを使ってRAGの前処理を自動化したいんだけど、誰か試した人いる?

      • #75677 返信
        名無しさん
        やってみたけど、結構パラメータ調整が必要。デフォルトだと傾き補正が弱い。

        • #75678 返信
          名無しさん
          なるほど、参考になる。自分も試してみるわ。

    • #75679 返信
      名無しさん
      オープンこれだけの精度はすごい。ただ、コミュニティの活動がまだ少ないから今後に期待。

13件の返信を表示中(うち親返信6件)
返信先: DeepSeekがDeepSeek OCRを公開で#75667に返信
あなたの情報:




AA
tchmii
タイトルとURLをコピーしました