もしも私が今から学問を学びなおすとしたら、プラトンの教えにしたがって数学から始めるだろう。

専門家というわけではないんだけど、データを扱う仕事をしています。データサイエンスなんていう言葉もすっかり時代遅れとなってしまった昨今ですが、それでもデータハンドリングの重要性は増していると思ってます。

それで、統計の勉強をどこからはじめたらいいですか、という質問をよく受けるんだけど、以前のエントリ では自分の本棚を晒しただけだったので、初学者がこれからデータを扱おうとする上でのおすすめの本を改めてまとめておきます。

 

 

グラフをつくる前に読む本 一瞬で伝わる表現はどのように生まれたのか

小一時間で読めます。いろんなグラフの特徴だけじゃなくて、そのグラフが誕生した経緯にも触れられていて読み物としておもしろい。なんとか分析、とかの前に、まずはグラフをつくってデータの特徴をみるのはデータ分析の鉄則だけど、そのグラフをつくる前に、どんなグラフをつくったらいいかを知ることは大切。

 

 

統計学が最強の学問である

「データサイエンス」という言葉が大流行したときに流行った本。これも手法について掘り下げるというよりも、なぜデータが大切なのか、が丁寧に書いてある。続編もたくさん出てるので、興味をもったらいろいろ読んでみてもいいかもしれない。

統計学が最強の学問である[実践編]――データ分析のための思想と方法

統計学が最強の学問である[ビジネス編]――データを利益に変える知恵とデザイン

統計学が最強の学問である[数学編]――データ分析と機械学習のための新しい教科書

 

 

統計学が最強の学問である

統計学が最強の学問である

 

 

 

心理統計学の基礎―統合的理解のために (有斐閣アルマ)

統計学をちゃんと勉強をしようと思ったら、この本を精読することを強くおすすめします。文体は非常に優しく、なんか簡単そうに書いてあるけど、かなり大切なことが網羅的に書いてあるので、この本をひととおり読んで理解できたら、統計解析の専門家、とまではいかなくとも、修士レベルの統計ユーザになれるでしょう。この本にも続編が出てます。

続・心理統計学の基礎--統合的理解を広げ深める (有斐閣アルマ)

心理統計学の基礎―統合的理解のために (有斐閣アルマ)

心理統計学の基礎―統合的理解のために (有斐閣アルマ)

 

 

 

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

実務レベルでどういう手法が必要になるかについて、事例も交えて紹介してくれているうえ、フリーで利用できるRの導入についても丁寧に解説してくれてる。実務レベルでは、t検定とか分散分析みたいないわゆる「統計学(推測統計)」を使うシーンってあんまりなくて、データの性質にあった作図をするか、それかクラスタリングとかディシジョンツリーみたいなデータマイニング的な手法のほうが向いてるデータを扱うことが多いです。改訂前の初版を読んだけど、改訂版が出てるので、これから読むなら改訂版のほうがいいです。こちらにも続編が。

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

データサイエンティスト養成読本 R活用編 【ビジネスデータ分析の現場で役立つ知識が満載! 】 (Software Design plus)

データサイエンティスト養成読本 登竜門編 (Software Design plus)

データサイエンティスト養成読本 機械学習入門編 (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

 

 

ほかにもいろいろおすすめの良書はたくさんあるんだけど、あんまり多くてもどれを選んでいいか分からなくなっちゃうのでこれくらいで。

 

あと、やっぱり手と頭を動かすのが一番。書を捨てよ、データを弄ろう。