かざいむ日誌

IT関係で知ったことなどを記事としてあげていきます。内容に不備や質問などあればぜひコメントをよせてください。

機械学習について勉強中。

Qiitaのこの記事に誘われて、まずは機械学習のキーワードを調べる。

機械学習はじめの一歩に役立つ記事のまとめ - Qiita

といっても、この資料ですごく分かりやすく説明されている。

www.slideshare.net

教師有学習/教師無学習
教師有
入力に対して、期待される出力yを教える
分析時は未知のxに対して、yを予測する

教師無
入力xをたくさん与えると、入力情報自体の性質に関して、何かしらの結果を返す
与えられたデータをまとめる、異常検知

そういった、判断の基準を線形分類器と呼ぶらしい。
学習するとその特徴に重みがつけられる

つまり、やりたいことは、教師有の機械学習で、色々と入力して、出力を教えて、
文字認識をさせる、こと、と言えるのかな。
そして、文字認識の線形分類器というのは具体的に何になるのか不明。
OpenCVで出来ると書いているが、線形分類器の定義の仕方、
学習のさせ方、他に何かやることがあるのかが不明。

 

さらに発展させる方法として、
効率良く更新する
オンライン学習
アンサンブル学習

大規模なデータを利用
分散学習
半教師有学習

より複雑な特徴を利用
深層学習
カーネル法