かざいむ日誌

IT関係で知ったことなどを記事としてあげていきます。内容に不備や質問などあればぜひコメントをよせてください。

online course

社会人のためのデータサイエンス演習 第1週 データサイエンスの領域、ビッグデータの3V

これはちょっと役に立った。データサイエンスのテーマを図式化したものだそうです。色々あるなぁとしか思ってなかったので知って少し整頓できそう。 データサイエンティスト スキルチェックリスト from The Japan DataScientist Society www.slideshare.net …

社会人のためのデータサイエンス入門 第3週 比率の見方、時系列データの見方

比率の見方 母数の異なるデータを比較する時は母数が違うので実際の数をそのまま比較することができない。例えば、県内に住む男女の数を全都道府県で比較する、GNPを国で比較するといった場合などである。もちろん男女の数は大都市が多いだろうし、GNPは国民…

社会人のためのデータサイエンス入門 第2週 標本分布

www.stat.go.jp 統計では対象すべてを調べる全数調査と一部のみ選んで調べる標本調査がある。この全数調査ではすべての対象をとらえることができるが、標本調査では母集団の一部だけのため、偏った一部のみを抜き出してしまう可能性がある。そうすると標本の…

社会人のためのデータサイエンス入門 第2週 回帰分析

2種類以上のデータの間の関係を読み取る方法を回帰分析という。 予測したい値のことを目的変数、分かっている値を説明変数という。 平たく言うとY=aX+bの式を求めること。 例えば降雨量を予想するのに、気圧、風速、湿度が影響すると考える。 湿度から降雨…