医療職からデータサイエンティストへ

統計学、機械学習に関する記事をまとめています。

平均値(mean)、中央値(median)、最頻値(mode)とは~森の統計辞典~

期待値とは:420

平均値とは

全てのデータの値を足して、データの数で割った値のことです。
森に住む10匹のうさぎの体重を測定したとします。

名前 体重(kg)
うさぎA 1
うさぎB 5
うさぎC 4
うさぎD 5
うさぎE 7
うさぎF 5
うさぎG 1
うさぎH 2
うさぎI 5
うさぎJ 4

体重の平均値は次のように計算します。

平均とは

全てのデータの値を、その出現確率と掛け合わせて足した値としても定義できます。
これは、一般的に期待値として知られた計算方法です。

期待値とは

中央値とは

全てのデータを大きさ順に並べて、真ん中にくる値のことです。
数が偶数の時は、真ん中二つの平均値が中央値となります。

中央値とは:420

最頻値とは

全てのデータの中で、一番多く出現する値のことです。

最頻値とは

まとめます

平均(mean)とは

  • 全てのデータの値を足して、データの数で割った値
  • 全てのデータの値を、その出現確率と掛け合わせて足した値
  • 期待値とほぼ同義

中央値(median)とは

  • 全てのデータを大きさ順に並べて、真ん中にくる値

最頻値(mode)とは

  • 全てのデータの中で、一番多く出現する値

次に読む

www.medi-08-data-06.work

おすすめ参考書など

統計検定2級レベルまでを学ぶためのおすすめ参考書です。

統計学がわかる ファーストブック

統計学がわかる ファーストブック

統計学が最強の学問である

統計学が最強の学問である

  • 作者:西内 啓
  • 発売日: 2013/01/24
  • メディア: 単行本(ソフトカバー)

また、udemyなどのオンライン講座での学習もおすすめです。

↓↓↓

※本記事は筆者が個人的に学んだこと感じたことをまとめた記事になります。所属する組織の意見・見解とは無関係です。