アイネクシオWebサイトドクター

WebサイトやWebシステムの悩みを解決します

スキル

  • PHP
  • Python
  • C#
  • Java
  • Swift
  • Dart
  • HTML(CSS
  • Javascript
  • MySQL
  • PostgreSQL
  • Sqlite
  • Access
  • Redhat系 Linux
  • Debian系 Linux
  • CodeIgniter
  • fuelPHP
  • CakePHP
  • flutter

Ubuntu 14.04 LTS でOCR(光学文字認識)

2024/10/03 2015/03/06

Category:Ubuntu, ソフトウェア, 開発環境 Tag:, , ,

打ち合わせの資料など、まだ印刷物をいただくケースが多いです。
WindowsであればWordやExcelなどで資料を作っていただけるので、そのデジタルデータをいただければまったくそれで問題ないんですが、なぜか印刷してお渡しいただけるんですよね。

それでも「デジタルデータをください」といって支給していただけるのがほとんどですが、いただけないケースもあります。中には、印刷物をスキャンしたり、携帯で撮影した写真を送ってくれたり、いろいろ試行錯誤してくれちゃったりします。
まぁ・・・迷惑なケースもありますが、いろんな理由があるのでしょうね。

そこで、OCRを利用してテキストデータとして作成しようという訳です。
Ubuntu 14.04 LTS を利用して作業を行います。

環境

PCの環境は良いとして、「tesseract-ocr」と「gImageReader」と「Googleドキュメント」をそれぞれ用意します。それぞれ得手不得手があるかもしれないので、比較として作業してみます。

  • Ubuntu 14.94 LTS
  • tesseract-ocr
  • gImageReader
  • Googleドキュメント
  • テキストがある画像データ

テキスト文字は以下のとおり。

テキストデータの文言は以下のとおり。
アイネクシオの売上はほどほどなので、もう少し頑張りたいです。
コンビニに寄った時、レジ横のアメリカンドックを2本衝動買いするくらいにはならないとダメですよね。
これからはもっと頑張ります。
/孝宏

画像は2点、横書きと縦書きを用意ました。

tesseract-ocr

「tesseract-ocr」はコマンドで操作します。
以下コマンドでインストール。

sudo apt-get install tesseract-ocr tesseract-ocr-jpn

コマンド操作

画像データから文字を認識して、テキストに保存することができます。

$ tesseract 元となる画像名 テキスト保存ファイル名 -l jpn

tesseract-ocrの結果

「tesseract-orc」の横書き認識結果は以下のとおり。

ァィネク シオの売上はほどほどなので` もう少し頑張り 、 , たいです〟 コンピ二に寄つた時` レジ横のアメ リ力ン ドツクを 2本 , ` 衝動貢いする〈 らいにはならないとダメですよね。 ー これからはもつと頑張ります。 /孝宏

「tesseract-orc」の縦書き認識結果は以下のとおり。

アィネクシオの売上はほどほどなので、 もう少し頑張り たいです〝 コンピ二に寄った時、 レジ横のアメリ力ンドックを2本 衝動貢いする〈らいにはならないとダメですよね〝 これからはもっと頑張ります〝 /孝宏

画像があってもなくても、横書きでも縦書きでも、それなりに問題なさそうに見えた。

gImageReader

「gImageReader」はGUIで操作します。
「tesseract-ocr」と同じように「tesseract-ocr-jpn」を利用するようです。
以下のコマンドでインストール。

sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader tesseract-ocr-jpn

GUI操作

下の画像、手順1~3のような手順で操作を進めます。
手順3のあと、テキストが出力されます。

手順1
手順2
手順3

gImageReaderの結果

「gImageReader」の横書き認識結果は以下のとおり。

アィネク シオの売上はほどほどなので` もう少し頑張り 、 , たいです。 ~ ー コンピ二に寄つた時` レジ横のアメ リ力ン ドツクを 2本 , ` 衝動貢いする〈 らいにはならないとダメですよね。 ー これからはもつと頑張ります。 /孝宏

「gImageReader」の縦書き認識結果は以下のとおり。

/ こ 衝 コ た ア 孝 れ 動 2 L` ィ 宏 か 貢 ヒ で ネ ら い 二 す ク はすに〝シ もる寄 オ つ〈つ の とらた 売 頑い時 上 張に` は りはレ ほ まなジ ど す b 横 ほ 〝なの ど ぃァ な と〝メ の タリ で メ力 ` でン も すド う よツ 少 柱ク し を 頑 2 張 本 り

横書きに関してはある程度問題なさそうだけど、縦書きは暗号に見えた。

Googleドキュメント

「Googleドキュメント」はブラウザで操作します。
Googleアカウントさえあれば利用できるので、一番簡単に試せるのかな。
もうUbuntuとか関係ないけどね。

ブラウザ操作

とってもシンプル。
アップロードした画像を「右クリック」->「アプリで開く」->「Googleドキュメント」で完了。

Googleドキュメントの結果

「Googleドキュメント」の横書き認識結果は以下のとおり。

たいです。
コンビニに寄った時、レジ横のアメリカンドックを2本
アイネクシオの売上はほどほどなので、もう少し頑張り
衝動買いするくらいにはならないとダメですよね。 これからはもっと頑張ります。孝宏

「Googleドキュメント」の縦書き認識結果は以下のとおり。

アイネクシオの売上はほどほどなので、もう少し頑張り たいです。 コンビニに寄った時、レジ横のアメリカンドックを2本 衝動買いするくらいにはならないとダメですよね。 」れからはもっと頑張ります。

元のデータと一緒に出力されるのが便利。
そして内容もほぼ問題ないレベル。

まとめ

なんか圧倒的に「Googleドキュメント」が使いやすかった。
元のファイルと一緒に出力されるとか、便利でしかなかった。

用意したファイルによって結果は変わるんでしょうし、学習機能もあるようなので利用シーンによってその価値は変わるのでしょうけど、とりあえず今回は「Googleドキュメント」。
あぁ~、Ubuntuとか本当に関係なくなっちゃった。

アバター画像
プログラマーとして存在しています。 コーヒーとヌーノ・ベッテンコート、リッチーコッツェンが大好き。ボクシングも大好き。家族も音楽も好き。仕事もそれなりに好き。仕事ください。

https://lit.link/grooveline

執筆者:TAKAHIRO