医療職からデータサイエンティストへ

統計学、機械学習に関する記事をまとめています。

リンゴで理解する条件付き期待値とは~パターン認識と機械学習~

パターン認識と機械学習第1章条件付き期待値についてまとめます。

条件付き期待値とは?

条件付き期待値とは、ある条件のもとで期待される値のことを指します(そのままですね...)。例えば、雨が降った時に傘を持っている人の数であったり、おしゃれをした時にナンパが成功する人数であったりそういった感じです。ここでは、分かりやすい例えの王者であるりんごで学んでいきます!
今箱の中にりんご10個がありそれぞれに1~10の番号が書いてあります。りんご一個を選びその番号×百円もらえるというゲームをする時、もらえる額の期待値は...
 1\times100\times\dfrac{1}{10}+2\times100\times\dfrac{1}{10}+\cdots + 10\times100\times\dfrac{1}{10} = 550
となります。
さて、ここでリンゴを赤箱3つと青箱1つに分けます。ただし図のように赤箱にはリンゴ3つずつ、青箱には1つのリンゴを入れることにしましょう。
f:id:h-wadsworth02:20181223142454j:plain:w400

この時、赤箱からリンゴを選んだ場合にもらえる額の期待値が条件付き期待値になります。赤箱には1~9番まで9個のリンゴがあるので、その期待値は
 1\times100\times\dfrac{1}{9}+2\times100\times\dfrac{1}{9}+\cdots + 9\times100\times\dfrac{1}{9} = 500
となりこれが条件付き期待値です!

もっと詳しく

ここからは成書に従って数式で条件付き期待値を追っていきます。まずは条件付き期待値の数式から

\large  E_{x}[f\,|\,y] = \sum_{x} p(x\,|\,y)\,f(x)

うーん、難しい....一つずつ見ていきます。
まずはf(x)から、これはあるリンゴの番号だった場合の金額を表す関数です。今回はリンゴの番号×百円なのでこれを関数で表すと...
\large f(x) = 100x
となります。お次は p(x\,|\,y)です。これは条件付き確率を表していて、赤箱を選んだ場合(p(y))に一つのリンゴを選ぶ確率(p(x))になります。赤箱には9個のリンゴがあるので、
 \large p(x\,|\,y) = \dfrac{1}{9}
となります。
最後に \sum_{x}は全てのx(1~9)について合計しろということなので、結局は
 1\times100\times\dfrac{1}{9}+2\times100\times\dfrac{1}{9}+\cdots + 9\times100\times\dfrac{1}{9} = 500
と上記と同じ結果になりました!

まとめ

今回は条件付き確率についてまとめてみました。難しく見える数式も分解していくと理解しやすくなります。

最後までお読み頂きありがとうございました!

参考にさせて頂いたサイト

条件付き期待値,分散の意味と有名公式 | 高校数学の美しい物語

参考書

パターン認識と機械学習 上

パターン認識と機械学習 上

  • 作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
  • 出版社/メーカー: 丸善出版
  • 発売日: 2012/04/05
  • メディア: 単行本(ソフトカバー)
  • 購入: 6人 クリック: 33回
  • この商品を含むブログ (20件) を見る