2018-01-01から1年間の記事一覧
前回はR関数を実行して、抽出されたサンプルから母集団の確率密度を推定しました。今回は、Rの関数を使わずにカーネル密度推定を行いたいと思います。 medi-data.hatenablog.com 出来るだけグラフィカルにまとめてみます。 ヒストグラム密度推定 カーネル密…
ヒストグラムから確率密度分布を知りたいと思い、調べているとカーネル密度推定なるものがあるようです。色々調べてみたのですが....よく分からん。 Rで実行しながら、学んでいきます。 今回のお題 今回は正規分布から発生させた50個の乱数を使って、正規分…
今回は回帰分析で用いられる回帰直線について、よく知られている最小二乗法、最尤法に加えて、最近学んだ期待損失なるものを使って、求めていきたいと思います! 今回のお題 今回は以下のようなデータセットを使って、回帰直線を求めていきます。 y1 <- roun…
今回はRで、ある関数を最大化、最小化する値を求めるoptim関数とotimize関数について、その違いや使い方について書いていきます。 optimize関数とoptim関数 この二つは、ある関数の中で値を最大化、最小化するパラメーターを求める時に利用します。簡単な例…
今回は、分類問題を学んでいてどうやら大きく分けて三つのアプローチがあるらしいと言うことで、その特徴を具体例を混じえてまとめてみます。 分類問題とは? そもそも分類問題とは、例えば身長データから男女を分類するであったり、メールに書いてある単語…
統計学を学んでいておそらくつまずくであろう尤度。こいつの正体をリンゴを使ってまとめていきます。 尤度とは? 尤度の何が難しいかと言うとまずはこの漢字。そもそも何と読むかと言うと"ゆうど"と読みます。”尤”なんて日常生活でまず使うことはありません…
パターン認識と機械学習第1章条件付き期待値についてまとめます。 条件付き期待値とは? 条件付き期待値とは、ある条件のもとで期待される値のことを指します(そのままですね...)。例えば、雨が降った時に傘を持っている人の数であったり、おしゃれをした時…
パターン認識と機械学習の第1章多項式曲線フィッティングについてまとめます。 多項式曲線フィッティング 多項式曲線フィッティングは、目的変数にうまくフィットするような線形モデルを作成します。今回はsin関数を多項式フィッティングしていきます。 > x …
データフレームを扱う時にとても便利なのがパイプ! ggplotでしか使ったことがなかったけれど、調べてみるととても便利そうなので使い方をまとめます! medi-data.hatenablog.com パイプとは? パイプとは、途中経過を変数に代入せずそのまま次の処理へ渡せ…
ggplot2でデータを可視化しようと試みると、パイプ演算子が使えずエラーに... 同じ悩みを抱えている方の助けになれば幸いです! Rの標準データセット"cars"の散布図をggplotで可視化しようとすると > cars %>% + ggplot(aes(x = speed , y = dsit) )+ + geom…
統計学を学んでいてRでシミュレーションをしたくなったある日のこと、確率密度関数の使い方がよく分からず困った.... 今回は、確率密度関数の使い方を正規分布を例にまとめてみます!! 正規分布の確率密度 Rの確率密度関数を調べてみると、 rnorm dnorm pnorm…