8300UFが新宿東ヨドバシで14800円-13%ポイント(2020円)だったんで買ってしまいました.
で、付属のOCRソフトをためしたんですが英文が全滅です。
単語と単語の間の空白をいれてくれないので、空白なしの文章ができてしまいます.
さらにイタリック体についてはすべて記号に化けてしまいました.
茶とらさんが読んdeココver.7のレポートをされてて、
単語はきちんとくぎっているようです。
ここで質問があります.
製品版でイタリック体とかその他の英文の書体も認識してくれるのでしょうか?
よろしくおねがいします。
書込番号:1600940
0点
2003/05/25 09:53(1年以上前)
ちゅんちゅんちゅんさん、こんにちは。HOJOです。
私もどなたかがこのレスをつけてくださるのを待っていたのですが、まだのようなので、とりあえずつなぎです。ただし私の持っている環境は、GT8200U,読んdeココpersonal、ドキュワークスV5、富士通の文書OCR v4ですから、ご要望の答えにはなりません。
私は通常は日本語のOCRを主体としていて、英語は日本文の中に一部が混ざる程度はありますが、英語のみのOCRを目的としたことはありません。その場合、殆ど富士通の文書OCRを使用しています。この場合の認識率は原稿によって変わります。つまり紙質、文字の大きさ、鮮明さ、背景の色やパターンです。更にスキャナーの分解能、二値化するときのしきい値、出力時の分解能(白黒二値)などです。今日本語の教科書の読み込みとそのOCRをやっていますが、ほぼ9〜10ポ程度の活字で、白い普通紙のテキストですが、今の認識精度は1000文字中10文字程度の誤認識があります。
これと全く同じ条件で英文のOCRをやってみました。(分解能400dpi,しきい値200),文字/線画、モノクロ)
To begin with, vve want to recognlze each other・ Ifeitherofus had known how long thisprOJectwould takeorthe alnountofwork required, we probablywould not have attelnpted it・ Becca hadjust conlpleted the first revision ofA【Zye′ C〃… ro rAe DYVZX”〃〃T
最後の方のA【Zye....は斜体の部分です。ここは全く認識されませんが、通常の英文は相当細かい文字、たぶん8〜9ポと思いますが、そこそこの認識精度です。しかし日本語の認識精度と比較するとまだまだの感じです。
これを富士ゼロックス社のドキュワークスに内蔵されたocrソフトで実行してみると(ドライバの条件は上と同じです。)
To begin with, we want to recognize each other. If either of us had known how long this project would take or the amount of work required, we probably would not have attempted it. Becca had just completed the first revision of A User Guide to the UNIX System
これはほぼ完璧な認識精度を見せてくれました。斜体の部分も全く問題がありません。このocrソフトはメディアドライブ社のものだそうです。不富士ゼロックス社のHPに、英文と日本文とのocr技術は大変異なるのだと書いてありました。従ってちゅんちゅんちゅんさんのターゲットが、英文だけなのか、それとも英文と日本文が混ざっているものなら、それによっても最適なocrソフトウェアが変わってくるのでしょうね。
ご参考まで
書込番号:1607244
0点
私もつなぎです。
買ったばかりの読んdeココVer9で、海外メーカのカタログで
やってみました。
カタログなので、条件のいいきれいな原稿を400dpiで
見やすい書体で、文字の大きさはfromという文字が縦2ミリ弱横5ミリに
収まる大きさです。
認識時に日本語設定のままだとスペースがつまるし
文字化けもしますが、英語設定で認識すれば
ほとんど間違いはなかったです。
たまに混じっている斜めの書体もほぼ正しく認識できています。
ただ文字間に余分なスペースが入ったりはしました。
e.Typist Ver8と比べました。
同じ大きさの文字で、横に80文字くらい縦20行くらいの
段落が左右に並んだ原稿で、上のとは別のページです。
e.Typistは、fをtに間違えた1箇所と文末のピリオドを無視したのが5箇所。
読んdeココVer9は、左の段落は完璧でしたが
右の段落は単語間のスペースが詰まって文字化けも所々混じり
めちゃくちゃな印象です。(実際そこまでひどくないはずですが)
左の段落を解除し右の段落だけにしたら、1箇所スペース無視、ピリオド
無視という良い結果になりました。
書込番号:1607757
0点
2003/05/27 14:58(1年以上前)
v8.0版とGT-8200Uでやってたことがありますけど、英文認識わるくなかったですよ。私の場合1年前くらいのことでしたが、大学で配られた英語講義のプリントを600dpiでスキャンしました。文字認識ソフトで認識させるときは600dpiくらいがいいんじゃないでしょうか。
書込番号:1614375
0点
このスレッドに書き込まれているキーワード
「EPSON > GT-8300UF」の新着クチコミ
| 内容・タイトル | 返信数 | 最終投稿日時 |
|---|---|---|
| 3 | 2006/06/22 21:04:27 | |
| 1 | 2006/04/27 7:26:39 | |
| 4 | 2004/03/16 2:33:36 | |
| 6 | 2004/02/08 19:56:16 | |
| 1 | 2004/01/02 18:13:37 | |
| 1 | 2004/01/03 18:39:17 | |
| 5 | 2003/12/01 22:54:11 | |
| 3 | 2003/10/29 20:22:29 | |
| 0 | 2003/10/11 16:33:20 | |
| 5 | 2003/09/20 0:11:00 |
クチコミ掲示板検索
新着ピックアップリスト
-
【欲しいものリスト】pc メイン
-
【Myコレクション】MyホワイトPC(良い点悪い点)
-
【欲しいものリスト】あ
-
【質問・アドバイス】a
-
【欲しいものリスト】PC
価格.comマガジン
注目トピックス
(パソコン)




