
このページのスレッド一覧(全64スレッド)

内容・タイトル | ナイスクチコミ数 | 返信数 | 最終投稿日時 |
---|---|---|---|
![]() |
0 | 5 | 2004年10月25日 00:23 |
![]() |
0 | 6 | 2004年10月24日 21:18 |
![]() |
0 | 2 | 2004年10月3日 13:45 |
![]() |
0 | 6 | 2004年10月1日 20:43 |
![]() |
0 | 3 | 2004年9月30日 15:47 |
![]() |
0 | 1 | 2004年9月28日 19:59 |

- 「質問の絞込み」の未返信、未解決は最新1年、解決済みは全期間のクチコミを表示しています


スキャナ > PFU > fi-5110EOX


三日前にイートレンド?さんからscansnapを購入して、悪戦苦闘しています。テキストのOCRを目的にいろいろ試しているんですが、PDFで取り込むと文字の精度に限界があるようで、jpegでとりこんでe.typist10でOCRをかけると、ほとんど修正点が見あたらず、かなり満足のいく透明テキストPDFができました。これならテキストの全文検索も夢じゃないかなと喜んでいたんですが、また一つ難問につまずいてしまいました。
取り込むテキストは二色刷で、時たま文字のバックが色つきのところは、OCRがうまくいきません。画像編集ソフトなどでバックを除去できないものか色々ネットで調べてみたんですが???です。photoshopあたりでできそうな気もするのですが、、、もし画像処理に詳しい方のアドバイスがいただけたらと思い書き込ませて頂きました。
0点


2004/10/23 19:18(1年以上前)
画像処理には、
1)着色部にバケツで白をぶちまける。
2)グレーレベルの調整で、白っぽくする。
3)コントラストを強くする。
等があります。
私は、PaintShopProですが、PhotoShopElementでも出来ます。
freeSoftでも、いろいろなSoftで出来ます。
書込番号:3416155
0点



2004/10/23 21:42(1年以上前)
和差U世さん、早速の返信ありがとうございます。教えて頂いた方法を試してみました。
1)着色部にバケツで白をぶちまける。→背景が、トーンのようにまだらになっていて部分的にしか白くならなかった
2)グレーレベルの調整で、白っぽくする。→部分的に処理する方法がほかの文字群がかすれて認識が悪くなったので断念
3)コントラストを強くする。→photoshopを全然使いこなせていないのでやり方がわからなかった
せっかく教えて頂いたのに、あまりに知識が乏しすぎてうまくいきませんでした。僕のやろうとしていることは、OCRソフトの性能の限界を超えているようです。色々試行錯誤しましたが、何せ処理の対象が莫大な枚数(千単位)なので一個でも処理項目が増えると、その都度リトライするのもばかばかしく、ある程度の完成度で妥協すべきだなと思い知らされた次第です。
けれど、スキャナもOCRソフトも数年前のことを思ったら、ようやく「使える」レベルになりましたね。和差U世さんありがとうございました。
書込番号:3416593
0点



2004/10/23 21:51(1年以上前)
すいません、訂正です
2)グレーレベルの調整で、白っぽくする。→部分的に処理する方法がわからず、ほかの文字群がかすれて認識が悪くなったので断念
追記 おそらく、僕の処理している文書は法律関係で正確さが必要なので、神経質になりすぎていると思います。ふつうの使い方なら、scansnapとe.typistで十分満足のいく品質だと思います。
書込番号:3416633
0点


2004/10/24 18:55(1年以上前)
取り込んだ画像がどんな感じなのか分からないので、想像ですが、Photoshopを持っていらっしゃるなら、チャンネルを使ってバックを除けませんか?
例えばモードをRGBにし、バックと文字のコントラストが最も高い(バックが最も薄い)チャンネルを抜き出す。更に色調補正でバックを切る。...というのはどうでしょう?
書込番号:3419765
0点



2004/10/25 00:23(1年以上前)
ひがんさん、ありがとうございます。早速試してみました。
背景の一部が一瞬で消え失せたのを見て、ちょっと感動してしまいました。
と喜んでみたものの、濃いグレーの上に刷られた文字の回りまでは修正できませんでした。それ以外のひがんさんに教わった方法で消える部分、色の濃淡に関しては、さほどOCRには影響ないようです。問題は黒に限りなく近い部分で、どんなに微量でも残っている(漫画のトーンのように)とOCRが文字の一部として認識して、誤認識してしまうようです。黒は文字と同色なのでさすがに薄くしすぎるわけにはいかないし、部分的に処理する手間を考えたらげんなりです。
しかし、ひがんさんのアドバイスのおかげで、OCRの弱点が絞り込めたので、どこまでをOCRに任せればよいかはっきりしました。問題の部分はOCR結果を自分で書き換えれば問題ないです。ありがとうございました。
書込番号:3420892
0点



スキャナ > PFU > fi-5110EOX


本(ペーパーバック)を取り込んでテキスト化し、PDAで読みたいと思っています。
けれども、下のjogjogjogjogさんの書き込みを拝見すると、AcrobatによるOCR精度はあまり高くないのでしょうか?
別にOCRソフトを買うとなると高くなるなあ、と尻込みしています。
使っている方、日本語、英語、それぞれの読み取り精度がどのようなものか感想を教えて頂けますか?
0点


2004/10/24 15:38(1年以上前)
どうも、ひがんさん。
たしかに、acrobatのOCR機能はe.typistに劣ります。あとテキスト化した後の確認、修正作業もacrobatではできなかったと思います。
けれど、PDAで読むだけであれば、テキスト化する必要はないと思いますよ。単に表示さえすればいいのであれば、scansnapで十分事足りると思います。
それにscansnapで処理すれば
1、PDFで保存できファイル規模がJPEGなどと比べ、小さい
2、PDFは複数ページを一つのファイルに取り纏めることができる
3、両面読み込みなのでとにかく速い
とまあ、PDAで読書するのにはもってこいだと思います。あくまで取り込んだ内容を全文検索や文字コピーなどするのであればOCRは必要というだけです。テキスト付PDFにすると、精度を保つためにどうしてもファイル規模が大きくなりますので、PDAのようなメモリの少ないのには適さないと思います。
acrobatのOCR精度は使っていないので何とも言えませんがacrobatもe.typistも体験版が利用できるので、自分で確かめるのが一番よいと思います。
参考までに、e.typistは、辞書を鍛えて、読み込み範囲を自分で細かく設定すれば、ほとんど修正箇所がいらないレベルまでにはなりました。(圧縮率低、解像度の高いjpegでOCRにかけた場合で、scansnapで取り込んだPDFでは精度は落ちる)。英語であれば、文字の構造が簡単なので日本語よりは正確に読み取れるはずです。
長々と書いてしまいましたが、手軽にやるのであればscansnap、ボタン一発でOKです。
書込番号:3419126
0点



2004/10/24 16:12(1年以上前)
ご返答ありがとうございます。
acrobatはsave asでテキスト文書にできるということでしたので、それをPDAの電子ブックソフトで読むことを考えておりました。
確かに読み取ったそのままで読んでいる方もいるようなのですが、テキスト化すると文字の大きさの変更も自由で、英語を読むときには辞書との連携も簡単だし、など一手間で読書環境があがるのならと思いつつも、そもそもOCRというものを使ったことが無かったので、どれぐらい使えるのか、とお尋ねしてみたのです(長い文章になってしまった...)。
でも、自分で買ってみていろいろ試してみるのが良さそうですね。
最初は置く場所が、とも思っていましたが、HPのムービーを見て思ったよりずっと小さいのにびっくりし、大分買いたい方向に傾いています。
書込番号:3419196
0点


2004/10/24 17:04(1年以上前)
テキストとは .txt の拡張子のファイルのことだったんですね。そっちのほうがPDFよりもずっとファイルサイズが小さいし、扱いやすいですね。
しかしOCRは、完璧を求めると間違いなく無間地獄行きです。納得のいく妥協点を見つけるのが賢い使い方ですね。
書込番号:3419362
0点


2004/10/24 18:39(1年以上前)
OCR精度に関する話題が出たので便乗して質問をさせて頂きたいと思います。
私は現在読んDEココ10を使っていますが、jogjogjogjogさんのレスを拝見し、e.typist10の精度に期待を寄せてしまいました。
実際にe.typist10の体験版を落としてきたところ、レイアウトが賢くなった点や精度が考えていた以上に高かった点で購買心が高まっています。
認識結果や操作に不満の残る部分は皆無とは言えませんが、それは読んdeココであっても同様です。
OCRの認識結果はスキャン画像に依存するところが大きいと思いますが、純粋にOCRとして比較した場合、ここに集まる皆様が付加機能や、認識精度、操作感などを総合的に観てどの製品が良い・悪いと判断するのか非常に興味がそそられます。
特に複数のOCRを扱った方の意見を聞かせて頂ければ幸いです。
書込番号:3419690
0点


2004/10/24 20:00(1年以上前)
参考までに読んdeココver.10とe.Typist ver10の使用感の比較を書かせて頂きます。scansnap購入と同時に両方使い始めて、今はe.typistを使用しています。
変換処理は初期状態では両者とも大差ないです。いかに誤認識を辞書に変換登録していくかが重要だと思います。(法律用語で欠缺という字を登録したが、それ以降は問題なく変換した。e.typistのみ確認)
さほど変換処理に差のない両者で、e.typistを常用している理由は、認識結果の表示がe.typistのほうが好みだったからです。よんでのほうは、結果を別枠でテキスト形式で表示するが、e.typistは元の画像に結果を貼り付けてくれ、一目で全体の一致、不一致を確認しやすかったです。そして、決定的だったのが、読んででは、OCR結果のテキスト部分を直に書き換えた文字だけが、acrobatの検索でヒットしなかったことです。誤り検索などで置換した語は問題なかったのですが。ここの問題は僕の使い方がまずいのかもしれないのですが、原因がわからないため、e.typistを常用するに至りました。修正機能の使いやすさでは読んでの方が一枚上手に思えたので、少し残念です。
書込番号:3419970
0点


2004/10/24 21:18(1年以上前)
jogjogjogjog様
早速のレスありがとうございます。
私がe.typist10体験版を使って不満を感じていたのは、jogjogjogjog様のご指摘通り修正の操作性でした。
この点に関しては読んdeココの方が使いやすいと言い切れます。
e.typist10は最近バージョンアップしたばかりなので、この操作性の向上は当分見込めそうにありません。
サーチエンジンであちこち見ていますが、はっきりとした決断がつきませんでした。
実際に入手してみないと判断できないのかもしれませんね。
御指南ありがとうございました。
書込番号:3420240
0点



スキャナ > PFU > fi-5110EOX


本機に関して教えてください
本機から出力されるPDFは一個の複数ページPDFなのでしょうか?
それともスキャンした各紙面ごとのバラバラのPDFなのでしょうか?
複数ページPDFで出力されるなら是非買いたいと考えています。
0点

jupiter secさん、こんばんは。
FUJITSUより
http://scansnap.fujitsu.com/jp/support/faq/5110eox/yomitori_qa005.html
2通りとも選択できるようです。
書込番号:3342924
0点



2004/10/03 13:45(1年以上前)
すたぱふ さん
情報を有難う御座います
両方出来るんですね〜 いいですね〜
下で話題になっている新機種を眺めてから決定したいと思います
書込番号:3344143
0点



スキャナ > PFU > fi-5110EOX


こんにちは。ScanSnapのように、簡単に大量の文章をPDF化してくれるスキャナを探していました。これをなんとかMacで使えるように出来ないでしょうか?ScanSnapがマック対応にならないかと期待しているのですが・・・。
0点


2004/07/02 00:42(1年以上前)
Virtual PC(エミュレータ)が使えるかもしれません。、Virtual PCとスキャ
ナーの動作環境がわかりませんので実際に可能かはわかりません。MacでWIN-
OSを動かすのでパソコンの処理速度は遅くなります。その処理速度も我慢でき
る範囲なのかも不明です。
個々のパソコン環境やその他の状況にもよりますが、私なら安いWINパソコン
モニタ切替え装置、モデムでLANをします。
詳しくは2chの掲示板で訊いてみては
Virtual PC For Mac OS Part15
http://pc5.2ch.net/test/read.cgi/mac/1086176631/
Virtual PCのサイト
http://www.microsoft.com/japan/mac/products/VirtualPC/default.asp
書込番号:2984279
0点


2004/07/05 18:54(1年以上前)
元OS8.5さん
どうもありがとうございました。
VirtualPCですね。調べてみます。
書込番号:2996942
0点


2004/07/21 08:00(1年以上前)
まもなくMac OSX用のドライバが発表になるそうですよ。(何時とは明言できません。ソースも示すことはできませんが、今後マメにHPをチェックしてみて下さい)
書込番号:3054358
0点


2004/07/22 21:59(1年以上前)
下記に発表になりました。使い勝手はWin同様に良いようです。
私も本日5110を購入しました。
http://scansnap.fujitsu.com/jp/download/5110eox.html#mac
書込番号:3060098
0点


2004/07/22 22:32(1年以上前)
ちなみに、下記にあるように
http://scansnap.fujitsu.com/jp/download/win-hikaku.html
PDF高圧縮保存はできないようです。
しかしそれでも他画像を用いれば十分実用に耐えますね。
書込番号:3060250
0点


2004/10/01 20:43(1年以上前)
便乗質問ですみませんが、教えてください。
今日fi-5110EOXをVPCで使ってみたのですが、scansnap mangerインストール直後の1回は問題なく使えたのですが、一旦VPCを終了してからは、どうやってもうまくいきません。ソフトを再インストールしても駄目でした。
何故でしょうか?
書込番号:3337633
0点



スキャナ > PFU > fi-5110EOX


現在購入を検討しているものです。現在のスキャナの用途としては
・幾つかの雑誌の保存しておきたいページをまずコピーしてスキャナで取り込み、OCRし透明テキスト付きPDFとして保存する
というパターンなのですが、現在はフラットベッドスキャナにて行っています。
このときに生じる問題点が、雑誌をコピーするときとスキャナで読みとるときに画像にわずかに傾きが生じるためOCRソフトや画像処理ソフトで傾きを自動補正(もしくは手動補正)すると微妙にカクカクした画像になることです。(ソフトウェア的な補正なので仕方ないとは思いますが)
最近のスキャナには読みとり時に自動で傾きを補正してくれる機能がついているようですがうちのスキャナ(E社GT-7000u)にはそういう機能がついてないためどんな感じに補正されるのかわかりません。一度読み込んだ画像をソフトウェア的に補正するとPHOTOSHOPなどの高級なソフトだろうと上記の現象が起きてしまうようです(試してみましたが)が読みとり時の補正ならそんなことはないのでしょうか?
実際にご使用されている方の使用感はいかがですか?
0点

スキャナの傾き補正といっても、別に傾きを検知してラインセンサーを傾けてスキャンするわけではないですから、基本的にはソフトウェアによる補正だと思いますよ。
それにスキャナに補正用の専用チップが載っているわけでもないでしょうからドライバソフトウェアによる補正なわけで、フォトショップによる補正と何ら変わりないと思います。
要は傾き補正のアルゴリズムの問題だと思います。傾きを補正したときに中間値の補間を行うかどうか等によって見た目のスムーズさが変わるのだと思います。
十分に高い分解能でスキャンを行い、画像回転時のデータ補間を行えば見た目はスムーズになるわけで、実際にこのスキャナでスーパーファインぐらいでスキャンを行っている限り、私は傾き補正時の問題は気になりません。
書込番号:3289039
0点



2004/09/20 16:31(1年以上前)
秋葉ごーごーさんレスありがとうございます。
言われてみればそうですよね、ドライバの質による違いで変わりそうです。
あと、ここに質問を書き込んだ後試してみたのですがOCRソフトの自動傾き補正をかけた場合とPHOTOSHOPで傾き補正した場合、PHOTOSHOPの方が大分滑らかでした。(というかほとんどわからなかった^^;)
以前試したときはうまくいかなかったような気がしたのですが、記憶違いだったようです。
ただ、PHOTOSHOPには自動で傾き補正をする機能がないもので困っております。プラグインであっても良さそうなものですが・・・
世の中うまくいきませんね。
ありがとうございました。
書込番号:3289935
0点

回転→角度補正の類いの機能でできませんか?
Photoshop Elementsでそういう機能があるんで
Photoshop でもできると思います。
by yammo
書込番号:3333150
0点



スキャナ > PFU > fi-5110EOX


引越しするのですが
引越し先はきわめて狭く本棚が置けません
そこで
一部の本をバラしてスキャンしようかと思っています。
どなたか製本をバラすという技術に詳しい方
コツとかありましたら教えてください。
0点

別に製本をバラす技術に詳しいわけではありませんが、
実際によくやっているので、経験からの知識を一つだけ。
ページは根元からちぎるのではなくて、スパッと切った方が良いです。
根元の部分にはノリのようなものがついていることが多く、
それがちょっとでも残っていると紙詰まりの原因になります。
最悪の場合、ラインセンサーの部分にノリ状のものがこびりついてしまったり
しますので、適当な厚さにちぎった後にローラーカッターのようなもので
スパッと綴じてある部分を切り落とすのが最良の方法だと思います。
書込番号:3325663
0点


クチコミ掲示板検索
新着ピックアップリスト
-
【欲しいものリスト】自作PC2025
-
【欲しいものリスト】メインアップグレードv4.22
-
【欲しいものリスト】NEW PC
-
【Myコレクション】からあげU20例
-
【欲しいものリスト】あつおくん新PC
価格.comマガジン
注目トピックス

(パソコン)
