
- 「質問の絞込み」の未返信、未解決は最新1年、解決済みは全期間のクチコミを表示しています


スキャナ > PFU > fi-5110EOX


本(ペーパーバック)を取り込んでテキスト化し、PDAで読みたいと思っています。
けれども、下のjogjogjogjogさんの書き込みを拝見すると、AcrobatによるOCR精度はあまり高くないのでしょうか?
別にOCRソフトを買うとなると高くなるなあ、と尻込みしています。
使っている方、日本語、英語、それぞれの読み取り精度がどのようなものか感想を教えて頂けますか?
0点


2004/10/24 15:38(1年以上前)
どうも、ひがんさん。
たしかに、acrobatのOCR機能はe.typistに劣ります。あとテキスト化した後の確認、修正作業もacrobatではできなかったと思います。
けれど、PDAで読むだけであれば、テキスト化する必要はないと思いますよ。単に表示さえすればいいのであれば、scansnapで十分事足りると思います。
それにscansnapで処理すれば
1、PDFで保存できファイル規模がJPEGなどと比べ、小さい
2、PDFは複数ページを一つのファイルに取り纏めることができる
3、両面読み込みなのでとにかく速い
とまあ、PDAで読書するのにはもってこいだと思います。あくまで取り込んだ内容を全文検索や文字コピーなどするのであればOCRは必要というだけです。テキスト付PDFにすると、精度を保つためにどうしてもファイル規模が大きくなりますので、PDAのようなメモリの少ないのには適さないと思います。
acrobatのOCR精度は使っていないので何とも言えませんがacrobatもe.typistも体験版が利用できるので、自分で確かめるのが一番よいと思います。
参考までに、e.typistは、辞書を鍛えて、読み込み範囲を自分で細かく設定すれば、ほとんど修正箇所がいらないレベルまでにはなりました。(圧縮率低、解像度の高いjpegでOCRにかけた場合で、scansnapで取り込んだPDFでは精度は落ちる)。英語であれば、文字の構造が簡単なので日本語よりは正確に読み取れるはずです。
長々と書いてしまいましたが、手軽にやるのであればscansnap、ボタン一発でOKです。
書込番号:3419126
0点



2004/10/24 16:12(1年以上前)
ご返答ありがとうございます。
acrobatはsave asでテキスト文書にできるということでしたので、それをPDAの電子ブックソフトで読むことを考えておりました。
確かに読み取ったそのままで読んでいる方もいるようなのですが、テキスト化すると文字の大きさの変更も自由で、英語を読むときには辞書との連携も簡単だし、など一手間で読書環境があがるのならと思いつつも、そもそもOCRというものを使ったことが無かったので、どれぐらい使えるのか、とお尋ねしてみたのです(長い文章になってしまった...)。
でも、自分で買ってみていろいろ試してみるのが良さそうですね。
最初は置く場所が、とも思っていましたが、HPのムービーを見て思ったよりずっと小さいのにびっくりし、大分買いたい方向に傾いています。
書込番号:3419196
0点


2004/10/24 17:04(1年以上前)
テキストとは .txt の拡張子のファイルのことだったんですね。そっちのほうがPDFよりもずっとファイルサイズが小さいし、扱いやすいですね。
しかしOCRは、完璧を求めると間違いなく無間地獄行きです。納得のいく妥協点を見つけるのが賢い使い方ですね。
書込番号:3419362
0点


2004/10/24 18:39(1年以上前)
OCR精度に関する話題が出たので便乗して質問をさせて頂きたいと思います。
私は現在読んDEココ10を使っていますが、jogjogjogjogさんのレスを拝見し、e.typist10の精度に期待を寄せてしまいました。
実際にe.typist10の体験版を落としてきたところ、レイアウトが賢くなった点や精度が考えていた以上に高かった点で購買心が高まっています。
認識結果や操作に不満の残る部分は皆無とは言えませんが、それは読んdeココであっても同様です。
OCRの認識結果はスキャン画像に依存するところが大きいと思いますが、純粋にOCRとして比較した場合、ここに集まる皆様が付加機能や、認識精度、操作感などを総合的に観てどの製品が良い・悪いと判断するのか非常に興味がそそられます。
特に複数のOCRを扱った方の意見を聞かせて頂ければ幸いです。
書込番号:3419690
0点


2004/10/24 20:00(1年以上前)
参考までに読んdeココver.10とe.Typist ver10の使用感の比較を書かせて頂きます。scansnap購入と同時に両方使い始めて、今はe.typistを使用しています。
変換処理は初期状態では両者とも大差ないです。いかに誤認識を辞書に変換登録していくかが重要だと思います。(法律用語で欠缺という字を登録したが、それ以降は問題なく変換した。e.typistのみ確認)
さほど変換処理に差のない両者で、e.typistを常用している理由は、認識結果の表示がe.typistのほうが好みだったからです。よんでのほうは、結果を別枠でテキスト形式で表示するが、e.typistは元の画像に結果を貼り付けてくれ、一目で全体の一致、不一致を確認しやすかったです。そして、決定的だったのが、読んででは、OCR結果のテキスト部分を直に書き換えた文字だけが、acrobatの検索でヒットしなかったことです。誤り検索などで置換した語は問題なかったのですが。ここの問題は僕の使い方がまずいのかもしれないのですが、原因がわからないため、e.typistを常用するに至りました。修正機能の使いやすさでは読んでの方が一枚上手に思えたので、少し残念です。
書込番号:3419970
0点


2004/10/24 21:18(1年以上前)
jogjogjogjog様
早速のレスありがとうございます。
私がe.typist10体験版を使って不満を感じていたのは、jogjogjogjog様のご指摘通り修正の操作性でした。
この点に関しては読んdeココの方が使いやすいと言い切れます。
e.typist10は最近バージョンアップしたばかりなので、この操作性の向上は当分見込めそうにありません。
サーチエンジンであちこち見ていますが、はっきりとした決断がつきませんでした。
実際に入手してみないと判断できないのかもしれませんね。
御指南ありがとうございました。
書込番号:3420240
0点



スキャナ > PFU > fi-5110EOX


三日前にイートレンド?さんからscansnapを購入して、悪戦苦闘しています。テキストのOCRを目的にいろいろ試しているんですが、PDFで取り込むと文字の精度に限界があるようで、jpegでとりこんでe.typist10でOCRをかけると、ほとんど修正点が見あたらず、かなり満足のいく透明テキストPDFができました。これならテキストの全文検索も夢じゃないかなと喜んでいたんですが、また一つ難問につまずいてしまいました。
取り込むテキストは二色刷で、時たま文字のバックが色つきのところは、OCRがうまくいきません。画像編集ソフトなどでバックを除去できないものか色々ネットで調べてみたんですが???です。photoshopあたりでできそうな気もするのですが、、、もし画像処理に詳しい方のアドバイスがいただけたらと思い書き込ませて頂きました。
0点


2004/10/23 19:18(1年以上前)
画像処理には、
1)着色部にバケツで白をぶちまける。
2)グレーレベルの調整で、白っぽくする。
3)コントラストを強くする。
等があります。
私は、PaintShopProですが、PhotoShopElementでも出来ます。
freeSoftでも、いろいろなSoftで出来ます。
書込番号:3416155
0点



2004/10/23 21:42(1年以上前)
和差U世さん、早速の返信ありがとうございます。教えて頂いた方法を試してみました。
1)着色部にバケツで白をぶちまける。→背景が、トーンのようにまだらになっていて部分的にしか白くならなかった
2)グレーレベルの調整で、白っぽくする。→部分的に処理する方法がほかの文字群がかすれて認識が悪くなったので断念
3)コントラストを強くする。→photoshopを全然使いこなせていないのでやり方がわからなかった
せっかく教えて頂いたのに、あまりに知識が乏しすぎてうまくいきませんでした。僕のやろうとしていることは、OCRソフトの性能の限界を超えているようです。色々試行錯誤しましたが、何せ処理の対象が莫大な枚数(千単位)なので一個でも処理項目が増えると、その都度リトライするのもばかばかしく、ある程度の完成度で妥協すべきだなと思い知らされた次第です。
けれど、スキャナもOCRソフトも数年前のことを思ったら、ようやく「使える」レベルになりましたね。和差U世さんありがとうございました。
書込番号:3416593
0点



2004/10/23 21:51(1年以上前)
すいません、訂正です
2)グレーレベルの調整で、白っぽくする。→部分的に処理する方法がわからず、ほかの文字群がかすれて認識が悪くなったので断念
追記 おそらく、僕の処理している文書は法律関係で正確さが必要なので、神経質になりすぎていると思います。ふつうの使い方なら、scansnapとe.typistで十分満足のいく品質だと思います。
書込番号:3416633
0点


2004/10/24 18:55(1年以上前)
取り込んだ画像がどんな感じなのか分からないので、想像ですが、Photoshopを持っていらっしゃるなら、チャンネルを使ってバックを除けませんか?
例えばモードをRGBにし、バックと文字のコントラストが最も高い(バックが最も薄い)チャンネルを抜き出す。更に色調補正でバックを切る。...というのはどうでしょう?
書込番号:3419765
0点



2004/10/25 00:23(1年以上前)
ひがんさん、ありがとうございます。早速試してみました。
背景の一部が一瞬で消え失せたのを見て、ちょっと感動してしまいました。
と喜んでみたものの、濃いグレーの上に刷られた文字の回りまでは修正できませんでした。それ以外のひがんさんに教わった方法で消える部分、色の濃淡に関しては、さほどOCRには影響ないようです。問題は黒に限りなく近い部分で、どんなに微量でも残っている(漫画のトーンのように)とOCRが文字の一部として認識して、誤認識してしまうようです。黒は文字と同色なのでさすがに薄くしすぎるわけにはいかないし、部分的に処理する手間を考えたらげんなりです。
しかし、ひがんさんのアドバイスのおかげで、OCRの弱点が絞り込めたので、どこまでをOCRに任せればよいかはっきりしました。問題の部分はOCR結果を自分で書き換えれば問題ないです。ありがとうございました。
書込番号:3420892
0点



スキャナ > PFU > fi-5110EOX


本機に関して教えてください
本機から出力されるPDFは一個の複数ページPDFなのでしょうか?
それともスキャンした各紙面ごとのバラバラのPDFなのでしょうか?
複数ページPDFで出力されるなら是非買いたいと考えています。
0点

jupiter secさん、こんばんは。
FUJITSUより
http://scansnap.fujitsu.com/jp/support/faq/5110eox/yomitori_qa005.html
2通りとも選択できるようです。
書込番号:3342924
0点



2004/10/03 13:45(1年以上前)
すたぱふ さん
情報を有難う御座います
両方出来るんですね〜 いいですね〜
下で話題になっている新機種を眺めてから決定したいと思います
書込番号:3344143
0点



スキャナ > PFU > fi-5110EOX


引越しするのですが
引越し先はきわめて狭く本棚が置けません
そこで
一部の本をバラしてスキャンしようかと思っています。
どなたか製本をバラすという技術に詳しい方
コツとかありましたら教えてください。
0点

別に製本をバラす技術に詳しいわけではありませんが、
実際によくやっているので、経験からの知識を一つだけ。
ページは根元からちぎるのではなくて、スパッと切った方が良いです。
根元の部分にはノリのようなものがついていることが多く、
それがちょっとでも残っていると紙詰まりの原因になります。
最悪の場合、ラインセンサーの部分にノリ状のものがこびりついてしまったり
しますので、適当な厚さにちぎった後にローラーカッターのようなもので
スパッと綴じてある部分を切り落とすのが最良の方法だと思います。
書込番号:3325663
0点



スキャナ > PFU > fi-5110EOX


fi-5110EOXの高速両面スキャンに魅かれ購入を検討中です。
私は現在フラットベッドスキャナー使用して雑誌のスクラップをメインにやっているのですが、誌面取り込み時に裏面文字・画像が透けて裏写りしてしまいます。
今は裏写りをを防ぐために誌面の上から黒いシートを被せることで対応しています。
fi-5110EOXの両面スキャンの場合は取り込みデータの裏写りなど問題はないのでしょうか?
それともなにか対応策などあるのでしょうか?
良かったら参考にしたいので教えてください。
0点


2004/09/27 00:42(1年以上前)
フラットベッドと変わる理由もないです。
フラットベッド並みに裏写りしてます。
画像の調整機能も、フラットベッドほど充実していません。明るさとコントラストという、昔と同じ。
裏写りが凄く気になるなら、向かないです。
裏写りを気にしなくても良いようなものだけに、使ってみるだけでも、十分価値はあるかも。
書込番号:3318887
0点



2004/09/27 01:12(1年以上前)
購入前にお話を伺うことが出来てよかったです。
TheCircleValleyさんの意見参考にさせていただきます。
ありがとうございます。
書込番号:3319004
0点


2004/09/27 10:42(1年以上前)
カラー原稿のカラー取り込みでは,目で見た通りの裏写りがあるようです.白黒取り込みにするとコントラストが強いので,裏写りはほとんど気にする必要はありませんが,色情報がなくなりますね.また,裏地が白紙でも印鑑がにじんだあとなどはカラーで認識してしまうようです.こんなときは,PCのタスクバーから片面読み取りを指定できますので,これで対処しています.
書込番号:3319797
0点



スキャナ > PFU > fi-5110EOX


気が付いたら名刺が千枚位溜ってしまって
検索ができなくなり
両面よみとりが良いようので
購入検討中、最有力候補です。
添付の名刺ファイリングOCRは
英語文字の認識率は高いでしょうか?
特にメールアドレスと
ホームページと英文住所
の部分。
このスキャナで使える別の良いOCRソフト(アクロバット以外)が
あればそれでも良いですが。
このスキャナ、ツワイン非対応のようなので
添付ソフト(アクロバット以外)の出来が悪いと投資がもったいないので。
名刺の整理に使っていらっしゃるかたが居れば
感想でもいいので教えて下さい。
0点


2004/09/25 17:04(1年以上前)
JPEGで保存してから、名刺ソフトでファイルから登録すればよろしいかと思います。
書込番号:3311985
0点



2004/09/25 17:26(1年以上前)
質問が正しく伝わってないかもしれません。
一番お聞きしたいのは英文が添付ソフトでちゃんとOCRできるかどうかなのです。
日本語OCRでは
英文名刺をうまく読み取れない物が
あると聞いています。
だからわざわざ日英文OCR可能と書いて売っているソフトもありますあります。
それと
JPEGにしてから
と言うことは二度手間になるのでは?
ワンアクションでやりたいのです。
書込番号:3312069
0点


2004/09/25 19:29(1年以上前)
両面スキャナは10万以下ではほとんどないですから、PFUのスキャナで二度手間でもやるしかないでしょうか。名刺の英文は、英文OCRでも、うまく読めないことが多く、手入力覚悟でおやりになれば?
書込番号:3312539
0点

ご心配には及ばないと思います。
添付の名刺ファイリングOCRは、通常の書体であれば英文でも問題なく
認識しますよ。感心するぐらいです。
ちゃんと役職や住所、メールアドレスなどインテリジェントに項目分けして
自動的に入力されてます。
ホームページは試してないのでわかりませんが、
項目があるのできっと大丈夫でしょう。
書込番号:3313039
0点


クチコミ掲示板検索
新着ピックアップリスト
価格.comマガジン
注目トピックス

(パソコン)
