tesseract-ocr in ios

Post on 22-Nov-2014

4.743 Views

Category:

Technology

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

 

TRANSCRIPT

0@reiji1020

0長崎県立大学シーボルト校国際情報学部情報メディア学科 2年

0 Obj-C/Unity4/JavaScript/C#

0 http://reiji1020.hatenablog.com/

文具メーカーからはスマホやタブレット用アプリと連動した商品が続々と発売されていますね

ShotNote(KING JIM製)

0ノートタイプ、付箋タイプ、ホワイトボードタイプが用意されている。

0日時、ページを読み取りデータに付加することができる

0 OCRすごい!

0企業発Appにしか搭載されていないのが残念…

0日本語を読んでほしいとは言わないから英語だけでも読めるとすごい

Tesseract-OCR

0フリーの文字認識ライブラリ

0最初はHPが開発していたが今はGoogleが支援・開発を行なっている

0生い立ちなど詳しいことはGoogle先生に聞いてみてね

0ダウンロードは以下のURLから

http://code.google.com/p/tesseract-ocr/

0インストールはWindowsだととても簡単。インストーラがあるので一発インストール

0 Macはmacportに対応しているのでこれまたインストールは簡単

sudo port install tesseract

0 Tesseract-OCRのライブラリはC/C++で書かれている

→Objective-Cでも使うことができる!

但しObj-Cソースコードの拡張子を*.mからObj-C++ソースコードの*.mmに変えなければならない

(obj-C++形式で書いていないソースコードも*.mmに変えておかないとビルドが通らない)

OpenCVと比較して

0 OpenCVでパターンマッチングを行おうと試みたが、実用的な精度が出ず断念

0 IplImageとUIImageの変換を行わなければならない

0 UIImageはRGBAの4チャンネル

0 IplImageはBGRの3チャンネルで扱う

0アプリ内で撮った写真を処理にかけるときは少々面倒である

0カメラ起動ボタンをタップするとカメラが起動

0必要部分をトリミング(自由に切り出せるように改良の余地あり)

0 Useボタンを押すと処理開始

0処理が終わると下に結果が表示される

0メリット0 処理速度がとても速い

0 英数の精度はとても良い

0 日本語も中々精度が高い

0 フリー

0デメリット0 角度を調整してあげないと誤認識が生じる(1→/)

0 数字と英語が混じっている文章では(フォントによって)0(ゼロ)とO(オー)、1とI(アイ)の誤認識が生じる0読み取りたい文章に合わせて言語ライブラリを絞ろう。

0参考スライド:http://www.slideshare.net/takmin/tesseract-ocr

top related