このエントリでは初学者向けの統計学の本を紹介する。
私自身が浅学ではあるが目線が同じ方向を向いてる分いきなりレベルが飛ぶことはないし、また古くからアカデミックで勉強してきたわけではないので、”苦労して読み込んだ本バイアス”はないものと自負している。また書籍も最新のものと古くから有名なものを比較して読んでいたので、これから勉強したいという人には少なからず参考になるかと思う。
ちなみにこの選定をするにあたってざっくり数えてみたら、統計関連で だいたい50冊ほど読んでいた。読み物系が4割、教科書的な参考書4割、手を動かしてみる系2割といった感じだ。
それを踏まえて今回は初学者向けに読み物系と教科書・参考書を紹介する。手を動かしてみる系はRやPythonといったもうワンステップ上のように思うのでここでは紹介しない。
読み物系
勉強する前に、またやる気がなくなった時に読むと面白いものを紹介する。これを読んだからと行って統計や分析の力が着くわけではないが、考え方が変わるときっかけになると思う。
かなり有名どころだけど、マーケティングについて”本物感”を感じられる一冊。広告を扱っている人間としてクライアントがこのように考えていると思うとやる気が出てくるし、逆にクライアントがこのように考えているのであれば、少なからず理解が必要だと思う。出てくる数式などは最初わからないが、勉強しているうちに何を言っているのかが分かると成長を感じられる。
この本は読み物として紹介したい。というのも、内容としては身近なデータに対しどんなことができるかという観点で書かれた本で『分析をするとは』を”ものすごくイメージしやすく書いた本”としてかなり有用だと思うが、細かい整合性についてはざっくりだな!という感じのホンだから。書店を探せば分かるけど、こういった考え方からやり方まで初学者に分かるように書かれた本は本当に少ない。なぜかって初学者に分かるように考え方から実際に手を動かすまでを現実的なデータでやろうとすると一冊で説明できるわけがないから。
この本はそんなかゆいところを、できるだけいろんなことを端折って書いてくれた本。だから実用的に真似だけするのは危険だけど、読み物として最初に読むにはおすすめ。特に『解析単位をきめろ』、『ビジネスインパクト・打ち手の考え方』こういった解析手法以前の内容はあまり他の書籍にないように思う。
これはざっくりと平均だけの判断は危険だよねって話だったり、こんなに現代人が”平均は〜”と言っている平均思考の歴史的背景を紹介してくれたりと目からうろこの本。そんな文脈で心理学的な側面の話もあったりと非常に面白く読めた。(最近読み返してないのであまり内容思い出せない笑)コックピットの設計の為、パイロットの体の数十箇所を計測しそれぞれの平均を測った。これで”平均的なパイロット”の体格が分かるだろうが、多少は足が長かったりする人もいるだろう。ではその”平均的なパイロット”の誤差30%(ちょっと太っていて足のサイズが小さかったり、痩せていて手が長かったり)の中にはどのくらいの割合が当てはまるだろう?ここからは是非本を読んで欲しい。平均について考えさせられる。
教科書的・参考書
実際に統計を使おうと思うと理論面での理解が必要だ。入門書的なものは結構いろいろ読んだが、やはり有名所のど定番は安定感がすごい。
この2冊は定番中の定番。とりあえずこれを読まないと始まらない感じ。
データ分析の先輩方のブログなどでは赤本、青本なんかと略されたりする。自然科学の方は少しむずかしいので、わからないところは飛ばしながら後々振り返るという勉強法がいいと思う。
これも定番中の定番。得られたデータに対し、他の変数で説明する為のモデルづくりをモデリングというが(定義は他の記事などを参考にしてください)、その考え方が書かれた本。モデリングに関しては聖書のような存在で、分厚そうに見えて中身は以外に初学者に優しい書き方をしてくれている。この本を理解するかいなかで統計っておもろい/おもろくないが分かれるのはないかと思っている。個人的にglmの考え方が理解できて、上の本で書いてあるいろんな知識がまとまったように感じた。
コメントを残す