Ubuntu 14.04 LTS でOCR（光学文字認識）

2024/10/03 2015/03/06

Category：Ubuntu, ソフトウェア, 開発環境 Tag：OCR, Ubuntu, UI, コマンド

打ち合わせの資料など、まだ印刷物をいただくケースが多いです。
WindowsであればWordやExcelなどで資料を作っていただけるので、そのデジタルデータをいただければまったくそれで問題ないんですが、なぜか印刷してお渡しいただけるんですよね。

それでも「デジタルデータをください」といって支給していただけるのがほとんどですが、いただけないケースもあります。中には、印刷物をスキャンしたり、携帯で撮影した写真を送ってくれたり、いろいろ試行錯誤してくれちゃったりします。
まぁ・・・迷惑なケースもありますが、いろんな理由があるのでしょうね。

そこで、OCRを利用してテキストデータとして作成しようという訳です。
Ubuntu 14.04 LTS を利用して作業を行います。

環境

PCの環境は良いとして、「tesseract-ocr」と「gImageReader」と「Googleドキュメント」をそれぞれ用意します。それぞれ得手不得手があるかもしれないので、比較として作業してみます。

Ubuntu 14.94 LTS
tesseract-ocr
gImageReader
Googleドキュメント
テキストがある画像データ

テキスト文字は以下のとおり。

テキストデータの文言は以下のとおり。
アイネクシオの売上はほどほどなので、もう少し頑張りたいです。
コンビニに寄った時、レジ横のアメリカンドックを2本衝動買いするくらいにはならないとダメですよね。
これからはもっと頑張ります。
／孝宏

画像は2点、横書きと縦書きを用意ました。

tesseract-ocr

「tesseract-ocr」はコマンドで操作します。
以下コマンドでインストール。

sudo apt-get install tesseract-ocr tesseract-ocr-jpn

コマンド操作

画像データから文字を認識して、テキストに保存することができます。

$ tesseract 元となる画像名 テキスト保存ファイル名 -l jpn

tesseract-ocrの結果

「tesseract-orc」の横書き認識結果は以下のとおり。

ァィネクシオの売上はほどほどなので` もう少し頑張り、 , たいです〟コンピ二に寄つた時` レジ横のアメリ力ンドツクを 2本 , ` 衝動貢いする〈らいにはならないとダメですよね。ーこれからはもつと頑張ります。 /孝宏

「tesseract-orc」の縦書き認識結果は以下のとおり。

アィネクシオの売上はほどほどなので、もう少し頑張りたいです〝コンピ二に寄った時、レジ横のアメリ力ンドックを2本衝動貢いする〈らいにはならないとダメですよね〝これからはもっと頑張ります〝 /孝宏

画像があってもなくても、横書きでも縦書きでも、それなりに問題なさそうに見えた。

gImageReader

「gImageReader」はGUIで操作します。
「tesseract-ocr」と同じように「tesseract-ocr-jpn」を利用するようです。
以下のコマンドでインストール。

sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader tesseract-ocr-jpn

GUI操作

下の画像、手順1～3のような手順で操作を進めます。
手順3のあと、テキストが出力されます。

gImageReaderの結果

「gImageReader」の横書き認識結果は以下のとおり。

アィネクシオの売上はほどほどなので` もう少し頑張り、 , たいです。 ~ ーコンピ二に寄つた時` レジ横のアメリ力ンドツクを 2本 , ` 衝動貢いする〈らいにはならないとダメですよね。ーこれからはもつと頑張ります。 /孝宏

「gImageReader」の縦書き認識結果は以下のとおり。

/ こ衝コたア孝れ動 2 L` ィ宏か貢ヒでネらい二すクはすに〝シもる寄オつ〈つのとらた売頑い時上張に` はりはレほまなジどす b 横ほ〝なのどぃァなと〝メのタリでメ力 ` でンもすドうよツ少柱クしを頑 2 張本り

横書きに関してはある程度問題なさそうだけど、縦書きは暗号に見えた。

Googleドキュメント

「Googleドキュメント」はブラウザで操作します。
Googleアカウントさえあれば利用できるので、一番簡単に試せるのかな。
もうUbuntuとか関係ないけどね。

ブラウザ操作

とってもシンプル。
アップロードした画像を「右クリック」->「アプリで開く」->「Googleドキュメント」で完了。

Googleドキュメントの結果

「Googleドキュメント」の横書き認識結果は以下のとおり。

たいです。
コンビニに寄った時、レジ横のアメリカンドックを2本
アイネクシオの売上はほどほどなので、もう少し頑張り
衝動買いするくらいにはならないとダメですよね。これからはもっと頑張ります。孝宏

「Googleドキュメント」の縦書き認識結果は以下のとおり。

アイネクシオの売上はほどほどなので、もう少し頑張りたいです。コンビニに寄った時、レジ横のアメリカンドックを2本衝動買いするくらいにはならないとダメですよね。」れからはもっと頑張ります。

元のデータと一緒に出力されるのが便利。
そして内容もほぼ問題ないレベル。

まとめ

なんか圧倒的に「Googleドキュメント」が使いやすかった。
元のファイルと一緒に出力されるとか、便利でしかなかった。

用意したファイルによって結果は変わるんでしょうし、学習機能もあるようなので利用シーンによってその価値は変わるのでしょうけど、とりあえず今回は「Googleドキュメント」。
あぁ～、Ubuntuとか本当に関係なくなっちゃった。

TAKAHIRO

プログラマーとして存在しています。コーヒーとヌーノ・ベッテンコート、リッチーコッツェンが大好き。ボクシングも大好き。家族も音楽も好き。仕事もそれなりに好き。仕事ください。

https://lit.link/grooveline

More Posts(70)

執筆者：TAKAHIRO