めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

データサイエンスに関する初心者向けの参考書

筆者が実際に読んだ(書いた)書籍の中で初心者向けのものを紹介しています。

※英語の書籍については、日本語版は読んでいないので、翻訳のクオリティなどは未確認です。

データサイエンスとは?

「そもそもデータサイエンスって何?」という事を理解するのに役立つ書籍です。

日本語版はこちらになります。

機械学習アルゴリズム

データサイエンスに必要なツールの1つに「機械学習」があります。上記の本にも機械学習アルゴリズムのふわっとした解説がありますが、もう少し、かっちりと理解したい方は下記をお勧めします。(手前味噌です。すいません。)

下記の本は、アルゴリズムに加えて、機械学習ライブラリ(scikit-learn)の使い方を学ぶことができます。

日本語版はこちらになります。

scikit-learnによる機械学習処理

scikit-learnを使って、具体的な機械学習処理を行う方法を学ぶには、こちらが最適です。

日本語版はこちらになります。

対話的分析ライブラリ

データサイエンスの手法である EDA(Exploratory Data Analysis)では、対話的にデータを分析していきます。下記は、EDA に必要となる Python のライブラリー(NumPy, pandas, matplotlib など)の使い方を学ぶ本です。

日本語版はこちらになります。

こちらも参考にしてください。

ディープラーニング

ディープラーニングに興味がある方は、こちらをどうぞ。

こちらは入門編です。

こちらはより本格的な解説書です。内容は高度ですが、前提知識のある方にはとても分かりやすくてお勧めです。

こちらは、後半部分でTensorFlowの基礎的な概念(グラフ、分散学習など)がきちんと説明されていて、DQN/RNNの実装例なども紹介されています。

Kerasの使い方が知りたい方は、こちらをどうぞ。

こちらは、自然言語処理に特化したニューラルネットワークの解説書です。RNNの構造なども詳しく解説されています。

その他

決して初心者向けではありませんが、下記は一般的な機械学習の理論について網羅的に説明された書籍です。

日本語版はこちらになります。