機械学習について勉強中。
Qiitaのこの記事に誘われて、まずは機械学習のキーワードを調べる。
といっても、この資料ですごく分かりやすく説明されている。
教師有学習/教師無学習
教師有
入力に対して、期待される出力yを教える
分析時は未知のxに対して、yを予測する
教師無
入力xをたくさん与えると、入力情報自体の性質に関して、何かしらの結果を返す
与えられたデータをまとめる、異常検知
そういった、判断の基準を線形分類器と呼ぶらしい。
学習するとその特徴に重みがつけられる
つまり、やりたいことは、教師有の機械学習で、色々と入力して、出力を教えて、
文字認識をさせる、こと、と言えるのかな。
そして、文字認識の線形分類器というのは具体的に何になるのか不明。
OpenCVで出来ると書いているが、線形分類器の定義の仕方、
学習のさせ方、他に何かやることがあるのかが不明。
さらに発展させる方法として、
効率良く更新する
オンライン学習
アンサンブル学習
大規模なデータを利用
分散学習
半教師有学習
より複雑な特徴を利用
深層学習
カーネル法