マイナー言語の手書き文字の認識させたい
以前にTesseract-OCRをちょっと触ったのだけど、そのままほったらかしていて、ちょっときっかけがあったのでまずは調査。
Tesseract-OCRでは、1行の印刷された文字の認識だったが、手書きの書類を認識させたい。それでちょっと調べました。これはOCRというくくりになるらしい。処理の流れは、レイアウト解析、行の切り出し、文字領域の切り出し、文字の認識となる。そして最初のレイアウト解析がけっこう肝らしい。
文字の読み取り・認識技術 | OCR技術解説 | メディアドライブ
レイアウト解析はあまり情報が公開されてないのだけど、Pythonのレイアウト解析、文字認識(フォント文字)のプロジェクトがある。これを使って何とかできないだろうか、、、。
手書き文字認識はこのスライドが参考になりそう。認識させたいのはラオス語で、母音字と子音字を組み合わせて描くので、母音と子音の組み合わせを1まとまりとして認識させた方が良さそうな気がする。
この分野で詳しい方いたら進め方についてアドバイスいただけませんか?
ちなみに手書き文字認識にはオンライン認識とオフライン認識があるそうな。オンラインは手で書いている筆順なども手掛かりに解析を行い、オフラインは画像情報だけで解析するんだそうな。