めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

データサイエンスに関する初心者向けの参考書

筆者が実際に読んだ(書いた)書籍の中で初心者向けのものを紹介しています。

※英語の書籍については、日本語版は読んでいないので、翻訳のクオリティなどは未確認です。

データサイエンスとは?

「そもそもデータサイエンスって何?」という事を理解するのに役立つ書籍です。

Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking

Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking

  • 作者:Foster Provost,Tom Fawcett
  • 出版社/メーカー: O'Reilly Media
  • 発売日: 2013/08/19
  • メディア: ペーパーバック

Doing Data Science: Straight Talk from the Frontline

Doing Data Science: Straight Talk from the Frontline

  • 作者:Cathy O'Neil,Rachel Schutt
  • 出版社/メーカー: O'Reilly Media
  • 発売日: 2013/11/03
  • メディア: ペーパーバック

日本語版はこちらになります。

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

  • 作者:Foster Provost,Tom Fawcett
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2014/07/19
  • メディア: 単行本(ソフトカバー)

データサイエンス講義

データサイエンス講義

  • 作者:Rachel Schutt,Cathy O'Neil
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2014/10/25
  • メディア: 単行本(ソフトカバー)

機械学習アルゴリズム

データサイエンスに必要なツールの1つに「機械学習」があります。上記の本にも機械学習アルゴリズムのふわっとした解説がありますが、もう少し、かっちりと理解したい方は下記をお勧めします。(手前味噌です。すいません。)

ITエンジニアのための機械学習理論入門

ITエンジニアのための機械学習理論入門

  • 作者:中井 悦司
  • 出版社/メーカー: 技術評論社
  • 発売日: 2015/10/17
  • メディア: 単行本(ソフトカバー)

下記の本は、アルゴリズムに加えて、機械学習ライブラリ(scikit-learn)の使い方を学ぶことができます。

Python Machine Learning, 1st Edition

Python Machine Learning, 1st Edition

  • 作者:Sebastian Raschka
  • 出版社/メーカー: Packt Publishing
  • 発売日: 2015/09/23
  • メディア: ペーパーバック

日本語版はこちらになります。

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

  • 作者:Sebastian Raschka
  • 出版社/メーカー: インプレス
  • 発売日: 2016/06/30
  • メディア: 単行本(ソフトカバー)

scikit-learnによる機械学習処理

scikit-learnを使って、具体的な機械学習処理を行う方法を学ぶには、こちらが最適です。

Introduction to Machine Learning with Python: A Guide for Data Scientists

Introduction to Machine Learning with Python: A Guide for Data Scientists

日本語版はこちらになります。

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

  • 作者:Andreas C. Muller,Sarah Guido
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2017/05/25
  • メディア: 単行本(ソフトカバー)

対話的分析ライブラリ

データサイエンスの手法である EDA(Exploratory Data Analysis)では、対話的にデータを分析していきます。下記は、EDA に必要となる Python のライブラリー(NumPy, pandas, matplotlib など)の使い方を学ぶ本です。

Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython

Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython

  • 作者:Wes McKinney
  • 出版社/メーカー: O'Reilly Media
  • 発売日: 2017/10/20
  • メディア: ペーパーバック

日本語版はこちらになります。

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

  • 作者:Wes McKinney
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2013/12/26
  • メディア: 大型本

こちらも参考にしてください。

ディープラーニング

ディープラーニングに興味がある方は、こちらをどうぞ。

こちらは入門編です。

こちらはより本格的な解説書です。内容は高度ですが、前提知識のある方にはとても分かりやすくてお勧めです。

Deep Learning (Adaptive Computation and Machine Learning series)

Deep Learning (Adaptive Computation and Machine Learning series)

こちらは、後半部分でTensorFlowの基礎的な概念(グラフ、分散学習など)がきちんと説明されていて、DQN/RNNの実装例なども紹介されています。

Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems

Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems

  • 作者:Aurélien Géron
  • 出版社/メーカー: O'Reilly Media
  • 発売日: 2017/04/18
  • メディア: ペーパーバック

scikit-learnとTensorFlowによる実践機械学習

scikit-learnとTensorFlowによる実践機械学習

  • 作者:Aurélien Géron
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2018/04/26
  • メディア: 単行本(ソフトカバー)

Kerasの使い方が知りたい方は、こちらをどうぞ。

Deep Learning with Python

Deep Learning with Python

  • 作者:Francois Chollet
  • 出版社/メーカー: Manning Publications
  • 発売日: 2017/12/22
  • メディア: ペーパーバック

PythonとKerasによるディープラーニング

PythonとKerasによるディープラーニング

  • 作者:Francois Chollet
  • 出版社/メーカー: マイナビ出版
  • 発売日: 2018/05/28
  • メディア: 単行本(ソフトカバー)

こちらは、自然言語処理に特化したニューラルネットワークの解説書です。RNNの構造なども詳しく解説されています。

Neural Network Methods for Natural Language Processing (Synthesis Lectures on Human Language Technologies)

Neural Network Methods for Natural Language Processing (Synthesis Lectures on Human Language Technologies)

  • 作者:Yoav Goldberg
  • 出版社/メーカー: Morgan & Claypool
  • 発売日: 2017/04/17
  • メディア: ペーパーバック

その他

決して初心者向けではありませんが、下記は一般的な機械学習の理論について網羅的に説明された書籍です。

Pattern Recognition and Machine Learning (Information Science and Statistics)

Pattern Recognition and Machine Learning (Information Science and Statistics)

  • 作者:Christopher M. Bishop
  • 出版社/メーカー: Springer
  • 発売日: 2011/04/06
  • メディア: ハードカバー

日本語版はこちらになります。

パターン認識と機械学習 上

パターン認識と機械学習 上

  • 作者:C.M. ビショップ
  • 出版社/メーカー: 丸善出版
  • 発売日: 2012/04/05
  • メディア: 単行本(ソフトカバー)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

  • 作者:C.M. ビショップ
  • 出版社/メーカー: 丸善出版
  • 発売日: 2012/02/29
  • メディア: 単行本