医療職からデータサイエンティストへ

統計学、機械学習に関する記事をまとめています。

一般化線形モデル・階層ベイズ・マルチレベル分析を実践的に学びたい人へのオススメ書籍5選

f:id:h-wadsworth02:20190217181937j:plain:w500

最近ではt検定、分散分析、線形回帰分析などを一般化線形モデルという 一つの概念で捉えられるようになってきました。

一般化線形モデルのメリットは現実の仮定を反映させながら自由な統計解析ができ、非線形データや複雑な階層性のあるデータなどにも柔軟に適応することができるところにあります。

しかし、多くの書籍ではその理論的な背景や数学的な証明に多くのページが割かれていて、「じゃあそれどうやって使うの?」と思ってしまう方もいるかと思います。(私はその典型です...^^;)

理論はそこそこに、実践的な使い方を体感しながら学べる書籍とは以外に少ないものです。

そんな方々に向けて、今回は既存の統計学と一般化線形モデルとの関連などの基本から、階層ベイズ、マルチレベル分析までの発展系を実践的に学べるオススメ書籍を紹介していきます!

①データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

1冊目はみどりぼんで有名な久保先生の書籍、私が一般化線形モデルを含む統計モデリングという概念に初めて触れたのがこの本です。 今までフローチャート的に二群の比較だったらt検定、三群だったら分散分析、正規分布じゃなかったらノンパラメトリック、多変量だったら線形回帰!などと教えられてきた私にとっては衝撃的な内容でした。

この本は既存の統計解析の限界から一般化線形モデルへの繋がり、さらにMCMCアルゴリズムを含む階層ベイズモデルにまで発展させていて、網羅的に学ぶには最適な本ではないかと思います。

内容自体は数式よりも具体例を使った解説が多く、ある程度統計学に触れたことのある方なら読みこなせる難易度です。また、有名な本だけあって分からない箇所等は調べてみると色々な方が解説をされているので、独学でも読み進めることができます。

既存の統計解析を使っていた人が統計モデリングってなに?と思った時には、このみどりぼんを最初に手にとってみることをオススメします!

ちなみに書籍内ではRを使った実践法も書かれているので手を動かしながら学ぶことができます。

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

②一般化線形モデル入門 原著第2版

みどりぼんの次に是非読んで頂きたいのがこちらの本です。入門とありますが少しレベルの高い内容になってます。内容としては、一般化線形混合モデルという階層データを扱うための統計モデリングを中心に扱っていて、学校の生徒と点数などといった分かりやすい具体例を使って解説されています。

尤度比検定を使ったモデル選択や、モデルに説明変数を追加した時の解釈方法などもまとまっていて、手元に置いておきたくなる一冊です。

みどり本を読んで、一般化線形モデル、混合モデルをもっと深く知りたいと思った方は是非読んでみてください!

一般化線形モデル入門 原著第2版

一般化線形モデル入門 原著第2版

③Rで学ぶ マルチレベルモデル[入門編]: 基本モデルの考え方と分析

3冊目は最近私が読んで感動した一冊です。2018年発売の比較的新しい本で、階層データを実践的に解析したいと思う方には是非読んで頂きたいです!

内容としては、そもそも階層データって何ですか?という初歩的なところから始まり、階層データに対して既存の統計手法を当てはめた時の問題点、モデルに変数を入れる際の加工法とその解釈の違い、モデルの比較法などが網羅的に、しかもとてつもなく分かりやすくまとまっています。

また、私が感動したポイントとして豊富なRでの実践もさることながら、最後のパートにある実例集です。このパートでは架空のデータではなく実際に集められたデータを使って解説されています。実データへのマルチレベル分析の適応とその解釈、そしてその解釈の限界までが書かれていて、実践的に使う人に寄り添っていたところに感動しました!

数式を使った理論については、必要最低限を本文内で、深いところは補足にとといった感じで、理論と実践法が絶妙なバランスで組み合わさっているので、比較的すらすらと読めるかと思います!

Rで学ぶ マルチレベルモデル[入門編]: 基本モデルの考え方と分析

Rで学ぶ マルチレベルモデル[入門編]: 基本モデルの考え方と分析

www.medi-08-data-06.work

www.medi-08-data-06.work

④個人と集団のマルチレベル分析

4冊目は、私がよくブログや資料スライドを参考にさせていただく清水先生の書籍です。こちらでも上記の本と同じで階層データに対するマルチレベル分析について書かれていますが、構造方式モデルリング(SEM)を含む、さらに複雑な解析をするための解析手法がまとめられています。

ターゲットしては、心理学、教育学、経済学、社会学などを専攻する学生や研究者向けとあり、主に文系の学生や研究者向けに書かれているため読みやすいです。

また、この本の特徴として理論的な説明以外にも、Rや SPSS、SAS、Mplus、また清水先生が作成したHADなどそれぞれのソフトの使い方にも多くのページが割かれていて、まさに実践むけの書籍であると言えます。

特にHADはExcel上で動作し無料で使えるので、R、SPSSなどの統計ソフトに使い慣れていない方でも手を動かしながら学べるかと思います!

個人と集団のマルチレベル分析

個人と集団のマルチレベル分析

⑤StanとRでベイズ統計モデリング

最後は、アヒルぼんと呼ばれるベイズ統計を学ぶ人なら一度は目にしておきたい本です。この本を最後にしたのは、階層ベイズを実践的に使いたい方には本当にオススメな一冊だからです!

最近のベイズ統計の盛り上がりに伴って、ベイズ統計に関する本が多数出版されている。しかし、一般にそれらの書籍は初歩的な内容にとどまるものか、難解な数式が多く実際の問題への応用が難しいものが多い。そこで、それらの書籍とは一線を画し、現実のデータ解析を念頭に置いて極めて実践的なベイズ統計モデリングの本に仕上げようと思ってできたのが本書である。

引用:本文あとがき

本文のあとがきにあるように"極めて実践的なベイズ統計モデリング"を学ぶための良書です。

詳細な理論よりも、あくまでデータ解析をするために必要な実践知を集約したような一冊で、数式が並んだ書籍を読んで「理屈よりも具体的にどう使うか教えてくれ!」と思ったことのある人にとっては読んでいて心地よいかと思います。

Stanを使った時のエラーに関するトラブルシューティングや、簡単なモデルから徐々に複雑なモデルになっていくストーリー性、躓きポイントの解説など、専門書ではめったに見られない読む人に優しく寄り添ってくれるような、そんな内容になってます!

また、理論面においても、統計モデリングの考え方や統計モデリングの視点からの確率分布の解説など、Rやstanを使わない人にとっても十分読む価値のある本です!

StanとRでベイズ統計モデリング (Wonderful R)

StanとRでベイズ統計モデリング (Wonderful R)

www.medi-08-data-06.work

www.medi-08-data-06.work

まとめ

今回は、一般化線形モデル・階層ベイズ・マルチレベル分析に焦点を当てて、実践的に学びたいという方にオススメな書籍を紹介していきました。 上記の5冊は、私が読んだ中でも実践応用をベースに書かれている数少ない書籍だと思います。

何ができて、どんな問題点があるのかを体感した上で理論を深掘っていくという学び方も悪くはないですよね。

他にもオススメ書籍等があればぜひ教えてください(^ ^)