2012年05月03日

◆ 書類を電子保存

 雑誌や書籍や社内広報などの書類を、電子化して保存するには、どうすればいいか? OCR によって書類の文字データを作ることが必要なので、それの可能なサービスを使えばいい。 ──
 
 具体的にそのサービス名を挙げると、Evernote が古くから有名だった。
 しかしこのたび、Google Drive という新たなサービスが出現した。これもまた、画像の OCR 読み取りが可能だ。……ということになっているのだが、ちょっと試した限りでは、認識されなかった。

 使い方は、簡単。単に画像ファイルをアップロードする。そのとき、「OCR 認識をするか?」という質問が表示されるから、チェックを入れて、アップロードすればいい。そうすると、画像と文書ができるはずなのだが、どういうわけか、画像のある文書ができるだけだった。OCR 認識された文字は現れなかった。

 そのうち何とかなるのかもしれませんね。今のところは、使い物にならないようだ。



 サンプル画像

ocr-sample.png

 
 この画像をダウンロードしてから、Google Drive にアップロードすると、OCR 読み取りができるかどうか、確認できる。
 私がやったら、OCR 読み取りはできませんでした。

 【 追記 】
 私の期待に応えて、早速、自分で試してくれた人がいた。誤認識も多いが、いくらかは認識できているようだ。
 下記のコメント欄を参照。



 [ 付記 ]
 大量にやるときは、いわゆる「自炊」をするので、ScanSnap などを使う。
 それを OCR ソフトで読み取ってもいいが、アップロードするだけで電子化できるならば、保存もできて、一石二鳥だ。……それが本項の話題。
posted by 管理人 at 12:32 | Comment(2) | コンピュータ_03 | 更新情報をチェックする
この記事へのコメント
いつも興味深くブログを拝見しております。
面白そうなので私もアップロードしてみました!
一応文字コードへの変換は実行されたようなのでご報告まで。
以下、サンプルをアップロードして出力されたテキストです。
**********
雑誌や書籍や社内広報などの文書を、 電子化して保存す
るには、 どうすればいいか? 。CRによって文書の文字デ =タを作ることが必要なので、 それの可能なサ=ビスを使 えばいい
具体的にそのサ=ビス名を挙げ る と、 E~'ern。te が古くか ら有名だった"
しかしこのたび、 G。。gーe Dri~'e という新たなサ...ピスが 出現した。 これもまた、 画の 。CR 読み取りが可能だ。
Posted by hayamag at 2012年05月03日 22:18
 2021-03-16 の時点で試してみたところ、正確に OCR 認識できていた。
 もはや十分な認識精度があるようだ。

 なお、操作の方法は下記に記してある。
  →  https://bit.ly/3bSoEih 

1.パソコンで drive.google.com を開きます。
2.目的のファイルを右クリックします。
3.[アプリで開く] 次の操作 [Google ドキュメント] をクリックします。 
Posted by 管理人 at 2021年03月16日 20:50
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。
  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ