name_untitledのエッセイ

IT関係で知ったことなどを記事としてあげていきます。内容に不備や質問などあればぜひコメントをよせてください。

今さらながらReveal.js、ScreenToGifを知りました。

今日流れてきたツイートでFlutterの紹介のプレゼンテーションのサイトがすごいよくできてて、どう作ってるか気になった。もちろん内容も面白かったです!

 

Dart/Flutter入門 + (自分用) 最強の勤怠アプリを作った話

↑埋め込み出来ないのが残念。

 

使っているのが、reveal.jsというライブラリで、HTMLをパワポみたいにプレゼンテーションの資料に出来るすごいライブラリです。結構有名なんですね。知らなかった。

revealjs.com

プログラマじゃない人向けにWebサービスも提供されているようです。色々とこれ系のサービスはあるけど、他のページを埋め込んで操作できるようにしたり、PDFに変換できたりとロックインされない感じが良いです。

slides.com

 

これで、良い感じにプレゼンテーションを作って、後はGIFのアニメーションを入れるとHTML上でデモも出来て良い感じ!見せるものがないので、ScratchのGIFアニメを置いておきます。

f:id:name_untitled:20180622233146g:plain

これはScreenToGifというツールで、PCの画面を録画して、GIFアニメを作ってくれるものです。

www.screentogif.com

 

勉強になりました。

社会人のためのデータサイエンス演習 第1週 データサイエンスの領域、ビッグデータの3V

これはちょっと役に立った。データサイエンスのテーマを図式化したものだそうです。色々あるなぁとしか思ってなかったので知って少し整頓できそう。https://image.slidesharecdn.com/random-151120084315-lva1-app6891/95/-52-1024.jpg?cb=1448354071

https://image.slidesharecdn.com/random-151120084315-lva1-app6891/95/-53-638.jpg?cb=1448354071

ãã¼ã¿ãµã¤ã¨ã³ãã£ã¹ã ã¹ã­ã«ãã§ãã¯ãªã¹ã

https://image.slidesharecdn.com/random-151120084315-lva1-app6891/95/-55-638.jpg?cb=1448354071

 

https://image.slidesharecdn.com/random-151120084315-lva1-app6891/95/-57-638.jpg?cb=1448354071

www.slideshare.net

 

ビッグデータの特徴として3Vが挙げられる。

Variety 種類

Volume 量

Velocity 早さ

色々な種類のデータが大量に、これまでにない速さで生まれている。

 

マイナー言語の手書き文字の認識させたい

 以前にTesseract-OCRをちょっと触ったのだけど、そのままほったらかしていて、ちょっときっかけがあったのでまずは調査。

nameuntitled.hatenablog.com

 

Tesseract-OCRでは、1行の印刷された文字の認識だったが、手書きの書類を認識させたい。それでちょっと調べました。これはOCRというくくりになるらしい。処理の流れは、レイアウト解析、行の切り出し、文字領域の切り出し、文字の認識となる。そして最初のレイアウト解析がけっこう肝らしい。

文字の読み取り・認識技術 | OCR技術解説 | メディアドライブ

teru0rc4.hatenablog.com

 

レイアウト解析はあまり情報が公開されてないのだけど、Pythonのレイアウト解析、文字認識(フォント文字)のプロジェクトがある。これを使って何とかできないだろうか、、、。

github.com

 

手書き文字認識はこのスライドが参考になりそう。認識させたいのはラオス語で、母音字と子音字を組み合わせて描くので、母音と子音の組み合わせを1まとまりとして認識させた方が良さそうな気がする。

www.slideshare.net

 

この分野で詳しい方いたら進め方についてアドバイスいただけませんか?

 

ちなみに手書き文字認識にはオンライン認識とオフライン認識があるそうな。オンラインは手で書いている筆順なども手掛かりに解析を行い、オフラインは画像情報だけで解析するんだそうな。

手書き文字認識 - Wikipedia

社会人のためのデータサイエンス入門 第3週 比率の見方、時系列データの見方

比率の見方

母数の異なるデータを比較する時は母数が違うので実際の数をそのまま比較することができない。例えば、県内に住む男女の数を全都道府県で比較する、GNPを国で比較するといった場合などである。もちろん男女の数は大都市が多いだろうし、GNPは国民の数を無視すると偏った結果になる。県民の数が同じだったらいいけど、そんなことは期待できない。そこで一般的には比率を計算しその比率を比較する。上の例で言うと、県ごとの男女比を出す、国民一人当たりの総生産を出すなどする。

この比率には、構成比と相対比の2種類がある。構成比は、全体のうちの割合を計算するもので、分母と分子が同じ単位である。県内の住民数と女性の数は両方とも人数である。一方で、相対比は、別の基準に対する割合で、分母と分子の単位が異なる。GNPは金額、国民の数は人数である。

どちらで計算するのがよいか考えた上で選ぶ。

時系列データの見方

時系列データにはストックデータとフローデータがある。講師が例として挙げていたのは、お風呂のお湯。たまっているお湯の量がストックデータ、蛇口から1分間に出るお湯の量がフローデータとのこと。例としては携帯の保有率がストックデータ、携帯の契約成立数がフローデータである。別の言葉で言うと、ストックデータは状態の数字、フローデータはイベントの数字かなと思う。

時系列データの2つの変数に相関があるという場合、片方の変化と同時にもう片方にも変化が現れる同時相関と、片方の変化の後しばらくしてもう片方に変化が現れる相互相関がある。

 過去のデータを元に将来の値を推測することを時系列予測という。時系列予測には多項式回帰と自己回帰モデルによる予測の2種類があるらしいのだがググる自己回帰モデルばかり出てくる。自己回帰モデルは、1つ前のデータをインプットにして次を計算してという形で再帰的に計算するっぽい。多項式回帰はちょっとググっただけでは分からないけど、資料とかを見るに多項式回帰では過去のデータから大まかなトレンドを算出して予測する物らしい。
ちょっとここはもう少し調べたい。

社会人のためのデータサイエンス入門 第2週 標本分布

www.stat.go.jp

 

統計では対象すべてを調べる全数調査と一部のみ選んで調べる標本調査がある。この全数調査ではすべての対象をとらえることができるが、標本調査では母集団の一部だけのため、偏った一部のみを抜き出してしまう可能性がある。そうすると標本のデータは信用できないということになって困ってしまう。そこで標本を何度も取った場合のデータをまた分布として想定する。この分布は正規分布になり、誤差が計算できるため、標本の平均から母数の平均が計算できる。

眠いと人に優しくなれない。もう少ししたら寝ます。おやすみなさい。

f:id:name_untitled:20180614221002j:plain

Photo by Krista Mangulsone on Unsplash

この間の状態がまだ続いている。

nameuntitled.hatenablog.com

ブログを書くのとともに、仕事や雑用をやってて寝るのが12時半とかになるのがこの1週間続いてる。それでふと気づくと何か、億劫に感じたり、被害妄想になりがちな気がしている。同僚が悩んでるときにアドバイスするのがちょっと遅かったり、自分ばかり頑張ってるのに他の人は認めてくれないような気がしたり。これは早く気付けて良かったが、このまま行くとけっこう危なかった。

気付くポイントとしては、気になることとかについて前にもこんなことあったかな、認めてくれないような気がするけど、何でそう思うのか、そういう状況にいるのは本当に自分だけかな、とちょっと考えてたら大分客観的に考えられました。

という訳でまずは睡眠を確保します。11時過ぎまでは起きてると思うけど、とりあえずおやすみなさい。 

アメリカ人の1日のデータ可視化が面白かった。

ツイッターで、@readymadegogo 松田直樹さんの発表についてツイートが流れてきて、最近SVG面白そうだなと思っていたので、ちょっと発表資料とかググってたら思っていたのを越えて面白そう。Visualizationに興味あったけど、データのアニメーションとか色々とキーワードが出てきて仕事にならない。まずは松田さんの紹介するこのサイトを見てみてほしい。

f:id:name_untitled:20180613221030p:plain

A Day in the Life of Americans | FlowingData

speakerdeck.com

そして、これがその松田さんの発表資料。

今まであまり知らなかったけどこの分野色々と出来そう。そして、SVGJavascriptで色々出来るならデザイナ、クリエーターでなくてもちょっと面白いもの作れそう!

後で自分が見るように松田さんの2年前?の発表動画のリンクを貼っておく。

vimeo.com

 

あと、上の可視化のサイトは独立の団体?か何かで、月$11ドルとかでチュートリアルとか見れるらしい。これもすごく良さそう。サイトを覗くだけでも色んなグラフが出てきて面白い。

flowingdata.com

あと、松田さんの紹介するSVGアニメーションのライブラリ、Tween.jsのShowcaseのサイトも面白い。名前がGreensockなのかTweenなのかよく分からんけど。

greensock.com