スキャナ > PFU > ScanSnap S500 FI-S500
カタログではOCRの認識率約20%向上とうたわれているようですが、
実際使ってみた感覚として雑誌などの認識率はどうですか?
わたしはコンピュータ関連の雑誌を電子化しようと考えています。
雑誌の場合、文章の背景に画像が使われていたり、見出しなどの文字サイズの違いが大きかったりすることが多いので心配です。
また、コンピュータ関連誌では英数字が多く混ざっているので日本語だけでなく、日本語文章中の英数字の認識率も気になっています。
認識率を気にするならこの機種で画像として読み込み、他のOCRソフトで変換した方がいいのかなとも考えています。
完璧なOCR変換は無理であるとは認識していますが、記事のキーワード検索程度に使える認識率はあるでしょうか?
書込番号:5138990
0点
OCRをかけると、どういう状態になっているか分かっていらっしゃいますか?元の画像データをそのまま忠実に残したまま検索をかけたい場合には、PDF作成機能の中にOCR機能を持って検索用のテキストを透明で貼り付けてくれるものを使うのが今のはやりです。
OCRで編集用のテキストデータを作ることが目的の場合は、OCR専用ソフトでもよろしいかと思います。OCRソフトでは、スキャンデータと変換したテキストデータを同時に持つ設定はありますが。
ファイルをPDFで保存するのか、TIFFとかJPEGなどの画像データで保存するのか、テキストなりリッチテキストの情報で保存するのか????? このあたりの言葉が分からなければ、OCRソフト(メディアドライブやAIソフト)のホームページでソフトの内容の情報を得られてから、相談されてはどうでしょうか。
書込番号:5142626
0点
ご回答有り難うございます。
それほどあやふやな記述をしたようには思っていないのですが、
何か足りなかったでしょうか。
出力としてほしいのは透明テキスト付きPDFです。
もしかして出力形式がPDFなのかテキストなのかでOCR変換に違いが出てきてしまうのでしょうか?
そんなことはないですよね。
ですのであくまでも「記事のキーワード検索程度に使える認識率」を
目指しています。完璧はOCR変換は目指していません。
他社製のOCR専用ソフトでもひどいものがあったため、
この機種のOCR機能についても不安を持っています。
有名どころのOCRソフトは一通り試していますので認識率の限界と差が大きいことは分かっているつもりです。
専用のOCRソフトを別途買わなくてもすむのなら得なのになぁと考えているわけです。
書込番号:5143074
0点
了解しました。
OCRとPDFは、セットではありませんので、そこのところが分かりませんでした。OCRは、機能であり、PDF、テキストはフォーマットとなります。
PDFは、本来、画像とテキストを持ったファイル(ワードとかエクセルとか)から作っていたものですが、後日、スキャンデータをJPEG(カラーの場合)のPDF内の画像としてファイル化したものです。
昔は、スキャンデータからPDF化したものはテキストデータを持たなかったのですが、後日、OCR機能を使って完全なテキスト化を試みたようですが、認識率の関係で出来ず、あくまでも検索用の目的でおまけ的に透明テキストとして画像の上にオーバーレイで貼り付けて使うようになったと理解しています。
OCRソフトで、TEXTフォーマットなりRichTEXTにして保存をすることを目的としたのではなく、PDFで保存と言うことで理解致しました。
今は、雑誌でPDF変換の中のOCRエンジンを評価するような記事が載ることがないので、どこのPDFソフトが良いのかは自分で試した等か分からないでしょうね。ただ、PDF変換の中でのOCRエンジンは、同じメーカーの単独のOCRソフト(富士通なり、AIソフトなり、メディアドライブなり)のエンジンと共通のことが多いですから、パッケージのOCRソフトの認識率の評価テストがあれば、どこの良いかはほぼ推測がつくのですが、今は、パソコン雑誌にOCRの評価テストが載ることはなく(昔は、たまに記事が載ったものなのですが)、情報はありません。
S500のユーザーからの書き込みを待ってみましょう。私は、古いScanSnapだし、OCRは単独でもPDFでも使わない(諦めてる)ので。
他の方の書き込みがありますように。
書込番号:5143381
0点
私はkoubekkoさんの最初の質問で十分理解できましたが。。。
読み取り後、同梱ソフト「ScanSnap Organizer」に転送する設定ですと一旦PDFに保存後、CPUの空き時間を利用して「ScanSnap Organizer」が独自に持つOCR機能で文字情報をPDFファイルにつけてくれます。
私はクレジットカードの請求書を2年分ほどまとめてSCANさせましたが、特殊な段組が多いせいか認識率がよくありませんでした。たとえばPDFを開き明細中の金額で検索をかけても全然ヒットしませんでした。
そこで私の場合はe.Typist Ver11のアップグレード版(Canonの一番安いフラットヘッドスキャナに同梱の簡易版e.Typistを持っていたので)をVectorからダウンロード販売で\4980で購入しました。一旦PDFに落ちたものをe.Typistから読み込みPDFを再作成させると、先程の請求書での金額検索はほぼ全てOKでした。
という訳で私の場合はスキャナしたあと、e.Typistを起動する設定にして使用しています。
書込番号:5277185
8点
このスレッドに書き込まれているキーワード
「PFU > ScanSnap S500 FI-S500」の新着クチコミ
| 内容・タイトル | 返信数 | 最終投稿日時 |
|---|---|---|
| 0 | 2012/05/02 17:24:58 | |
| 1 | 2013/08/01 7:16:27 | |
| 1 | 2008/05/04 6:03:19 | |
| 2 | 2007/11/23 17:52:11 | |
| 3 | 2007/04/26 19:06:30 | |
| 4 | 2008/04/12 17:48:26 | |
| 4 | 2007/03/11 20:29:11 | |
| 4 | 2007/03/17 22:57:37 | |
| 9 | 2007/02/21 9:13:29 | |
| 5 | 2007/02/07 23:47:17 |
クチコミ掲示板検索
新着ピックアップリスト
-
【Myコレクション】Windows11対応でCPU換装とディスク増強
-
【Myコレクション】pc
-
【Myコレクション】メインアップグレード最終稿
-
【Myコレクション】自作パソコン
-
【Myコレクション】SUBPC 2025 WHITE
価格.comマガジン
注目トピックス
(パソコン)




