医療職からデータサイエンティストへ

統計学、機械学習に関する記事をまとめています。

リンゴで理解する 尤度 とは~離散確率から正規分布まで~

統計学を学んでいておそらくつまずくであろう尤度。こいつの正体をリンゴを使ってまとめていきます。 尤度とは? 尤度の何が難しいかと言うとまずはこの漢字。そもそも何と読むかと言うと"ゆうど"と読みます。”尤”なんて日常生活でまず使うことはありません…

リンゴで理解する条件付き期待値とは~パターン認識と機械学習~

パターン認識と機械学習第1章条件付き期待値についてまとめます。 条件付き期待値とは? 条件付き期待値とは、ある条件のもとで期待される値のことを指します(そのままですね...)。例えば、雨が降った時に傘を持っている人の数であったり、おしゃれをした時…

多項式曲線フィッティング~パターン認識と機械学習~

パターン認識と機械学習の第1章多項式曲線フィッティングについてまとめます。 多項式曲線フィッティング 多項式曲線フィッティングは、目的変数にうまくフィットするような線形モデルを作成します。今回はsin関数を多項式フィッティングしていきます。 > x …

これは便利! R パイプ %>% の使い方

データフレームを扱う時にとても便利なのがパイプ! ggplotでしか使ったことがなかったけれど、調べてみるととても便利そうなので使い方をまとめます! medi-data.hatenablog.com パイプとは? パイプとは、途中経過を変数に代入せずそのまま次の処理へ渡せ…

R の パイプ でエラー ”関数 "%>%" を見つけることができませんでした ”Error: could not find function "%>%””

R

ggplot2でデータを可視化しようと試みると、パイプ演算子が使えずエラーに... 同じ悩みを抱えている方の助けになれば幸いです! Rの標準データセット"cars"の散布図をggplotで可視化しようとすると > cars %>% + ggplot(aes(x = speed , y = dsit) )+ + geom…

R の 確率密度関数 ( rnorm, pnorm, qnorm, dnorm ) とは何なのか

R

統計学を学んでいてRでシミュレーションをしたくなったある日のこと、確率密度関数の使い方がよく分からず困った.... 今回は、確率密度関数の使い方を正規分布を例にまとめてみます!! 正規分布の確率密度 Rの確率密度関数を調べてみると、 rnorm dnorm pnorm…