『OCR化されたPDF』のクチコミ掲示板

> > > > > クチコミ掲示板
fi-5110EOX 製品画像

拡大

価格情報の登録がありません 価格推移グラフ


価格帯:¥―〜¥― (―店舗) メーカー希望小売価格:オープン
ネットで買うなら!クレジットカード比較
この製品をキープ

ご利用の前にお読みください

  • fi-5110EOXの価格比較
  • fi-5110EOXの店頭購入
  • fi-5110EOXのスペック・仕様
  • fi-5110EOXのレビュー
  • fi-5110EOXのクチコミ
  • fi-5110EOXの画像・動画
  • fi-5110EOXのピックアップリスト
  • fi-5110EOXのオークション

fi-5110EOXPFU

最安価格(税込):価格情報の登録がありません 発売日:2004年 2月28日

  • fi-5110EOXの価格比較
  • fi-5110EOXの店頭購入
  • fi-5110EOXのスペック・仕様
  • fi-5110EOXのレビュー
  • fi-5110EOXのクチコミ
  • fi-5110EOXの画像・動画
  • fi-5110EOXのピックアップリスト
  • fi-5110EOXのオークション

『OCR化されたPDF』 のクチコミ掲示板

RSS


「fi-5110EOX」のクチコミ掲示板に
fi-5110EOXを新規書き込みfi-5110EOXをヘルプ付 新規書き込み



ナイスクチコミ0

返信4

お気に入りに追加

標準

OCR化されたPDF

2004/03/23 01:05(1年以上前)


スキャナ > PFU > fi-5110EOX

スレ主 PAPER CAPTUREさん

ScanSnap fi-5110EOXというのを購入しました。
これに、ACROBAT STANDARD がついてきます。
このスキャナは、CPU 1.8G以上ないと一定の読み取り速度が確保できないようです。
両面印刷の書籍をばらして、50枚ほど一度に読み込ませました。
大体3分で読み終えます。50枚、両面読み取りを考えると、
100ページ3分で読み取りが終わりました。600DPI程度にしては早い。
でも、できたのは 画像形式のPDFです。
そこで さらに、ACROBAT PRO を購入。追加で2万円かかりました。
なぜPROにしたかというと、このACROBAT PRO に PAPER CAPTURE
という機能がついていているからです。
この機能は 画像PDFを ワード、リッチテキストなどのOCRで読み取れる形で自動出力をしてくれます。
いうならばOCR化されたPDFです。

ところでPAPER CAPTUREを使いワードで読み込んだ場合、文章に型崩れがおきます。型崩れしないようにPDFをワード出力するには omni page pro14 が必要らしい。
http://www.pugh.co.uk/Products/scansoft/omnipagepro14.htm
が 値段は5万円する。
でも ワードで読み込んで 再加工できる。型崩れしないから、加工が簡単。
そしてまた、ワードから、PDFに変換できるのは、当然です。
ワードについているPDFのアイコンを叩くだけで全自動でPDFが作成されます。
こうなると相互の往復が可能です。
>>>>>>>>>>>>>>>>>>>>>>
つまり 人に渡す際は、受け取る側が安心して開ける、PDF形式にして渡す。
インターネット上のPDFが画像文字状態なら、これをワード等でOCR化を行える。そして 再度、検索可能な形式で保存する。
だから、自分の注釈を加えて保存もできる。翻訳ソフトにかけて日本語にすることも可能です。
さらに 一度、ワードなどから作成したPDFファイルは、ADOBE ACROBAT 6 PRO を使えば検索が可能です。
再変換したPDFは、OCR読み取りを終えた文字情報となるからです。
こうなると ADOBE ACROBAT 6 PRO を使えば文章の一部に検索したいものがあれば、拾ってこられる。
単に、文章の表題でなくて、本文の一部に特定の言葉が含まれれて入るだけでも検索はOKです。
OCR化したPDF形式ならデーターバンクを作れる。
短時間のスキャンで、巨大なデーターベースができる時代になってきた。
と感じました。

書込番号:2617503

ナイスクチコミ!0


返信する
ららぼさん

2004/03/24 12:43(1年以上前)

質問いたします。

>CPU 1.8G以上ないと一定の読み取り速度が確保できないようです。

とありますが、これはセレロンの事ですか?

書込番号:2622629

ナイスクチコミ!0


OCR化されたPDFさん

2004/03/30 22:22(1年以上前)

自分の環境では、PEN4で2.8G
職場の書類を毎日1000枚程度、8時間の勤務時間で以下の工程処理でPDF化してます。
工程は以下の4まであります。だから、高速なCPUが必要です。
最後の4は無視しても構いません。

読み取りは、カラー画像を無視して、白黒で読み込ませます。
マーカーのアンダーラインを無視して、白黒で読み込ませないと
OCR化できません。決済印など朱肉押印があるページも最終的にデーターベース化して、検索できるようにするためです。

読み込みの後、縦横の自動変換がうまくできているか確認。
おかしいものは、ADOBEのアクロバットで回転処理する。

paper capture 化する。検索できるデーターベースにするためです。
CPUの能力を限界まで使う処理をします。
上記1のキャプチャと同程度の時間がかかります。

構造化する。PDFにタグを埋め込む。

自宅にある検索する気持ちになれない分厚い辞典も、PDFにすれば使えるようになると期待してます。

書込番号:2648423

ナイスクチコミ!0


ららぼさん

2004/04/06 23:52(1年以上前)

OCR化されたPDF さん

御返事ありがとうございます。

私のほうの書き込みが遅れて申し訳ありません。

>PEN4で2.8G、職場の書類を毎日1000枚程度、8時間の勤務時間で以下の工程処理でPDF化してます。

ですか、私のデスクトップ(セレロン1.2)では厳しいですね。
大変参考になりました。
ありがとうございました。

書込番号:2674578

ナイスクチコミ!0


yammoさん
クチコミ投稿数:6616件Goodアンサー獲得:178件 これはどう?(BLOG) 

2004/04/12 23:50(1年以上前)

Acrobat 6.0 Standard でも Paper Capture 使えるみたいですよ。

●ScanSnap > 導入事例 > 導入事例1
http://scansnap.fujitsu.com/jp/case/001.html

# もう読まれていないかもしれませんけど…

by yammo

書込番号:2694313

ナイスクチコミ!0


クチコミ一覧を見る


この製品の最安価格を見る

fi-5110EOX
PFU

fi-5110EOX

最安価格(税込): 価格情報の登録がありません   発売日:2004年 2月28日

fi-5110EOXをお気に入り製品に追加する <15

のユーザーが価格変動や値下がり通知、クチコミ・レビュー通知、購入メモ等を利用中です

クチコミ掲示板検索



検索対象カテゴリ
を対象として
選び方ガイド

製品選びに必要な知識を
みんなで共有!

[スキャナ]

スキャナの選び方ガイド

新着ピックアップリスト

ピックアップリストトップ

新製品ニュース Headline

更新日:10月15日

新製品ニュースを見る

クチコミ掲示板ランキング

(パソコン)

ユーザー満足度ランキング