めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

「技術者のための確率統計学」が出版されます

www.shoeisha.co.jp

表題の書籍が翔泳社より出版されることになりました。査読に参加いただいた読者の方を含め、編集・校正・組版・イラストデザインなどなど、本書の作成に関わっていただいたすべての方々に改めてお礼を申し上げます。

これでついに(!)「技術者のための基礎解析学」「技術者のための線形代数学」とあわせた三部作が完成となりました。

「昔勉強した気がするけど、もうすっかり忘れちゃった」「あのカタイ数学の世界をもう一度、真面目に振り返りたい」―― そんな読者を想定したこれらの書籍を執筆するきっかけは、やはり昨今の「機械学習ブーム」でした。2015年に出版させていただいた「ITエンジニアのための機械学習理論入門」では、細かな数式を含む計算は、すべて「数学徒の小部屋」と題したコラム枠に押し込めていたのですが、その後、読者の方から「ここに書かれている数式を理解したくて、もう一度、数学の勉強をはじめました!」という声をいただくと同時に、「中井さん・・・次は数学の本でも・・・・」という謎のつぶやきが私の耳元でささやかれはじめたのです。

これはどうしたものかと思案した結果、「機械学習の専門書、あるいは、論文に登場するような数式を理解する」「そのための第一歩となる内容」をまずはストレートに提供しようと思い至り、この三部作に取り組むことになりました。

ちなみに、「機械学習に必要な数学」という言葉(概念?)には謎の魔力があるようで、「そもそもいらんだろ」から始まり、「この程度は普通にどっかで勉強してるだろ」まで、とてもとてもとてもとても幅広い見解があるようです。そのような中で、本シリーズの位置づけを語るのは本当に難しいのですが、私にとっては、Twitter で見かけたこのつぶやきがすべてです*1


「この手の数学は大学で一瞬やった気がするけど忘却の彼方で、でも機械学習の文献に出てくるからやり直したい」というプログラマへのど真ん中の回答


いずれにしても、書店にて実際に内容を見ていただくのがベストだと思いますが、「発売が待ちきれない!いますぐ予約するよ!」というみなさまのために、まずは本書より、「はじめに」と「各章の概要」を抜粋させていただきます。

はじめに

 みなさんは、「確率モデル」という言葉を聞いたことがあるでしょうか?――『技術者のための基礎解析学』『技術者のための線形代数学』の姉妹編として、確率統計学を扱う本書では、この確率モデルの考え方によって、抽象的な確率空間が果たす役割を明確にするというアプローチを取りました。
 第1章の冒頭で説明するように、確率モデルというのは、現実世界の不確定な現象を「コンピューターの乱数によるシミュレーション」として再現する枠組みと捉えることができます。このような確率モデルの考え方を理解することが、確率統計学を学ぶ上での1つのポイントとなります。さらにその上で、条件付き確率や事象の独立性など、ともすれば直感的な理解にとどまりがちな点について、その基本的な性質をできるだけ厳密に導出することを心がけています。――実は、ここには、確率空間の「仕組み」を理解するという意図があります。これにより、パラメトリック推定や仮説検定など、確率モデルを構成・検証する手続きについて、その役割をより明瞭に理解することができます。
 「機械学習に必要な数学をもう一度しっかりと勉強したい」、そんな読者の声が本シリーズを執筆するきっかけでしたが、今、IT業界を中心とするエンジニアの方々からは、機械学習の理解という目的に限らず、もう一度、数学を学び直したいという声を耳にすることが増えてきました。プロとしてITに関わる方なら誰もが知っているように、ITを学ぶ際に最も大切なことは、表面的なコマンドの使い方を覚えるだけではなく、その背後に隠された「仕組み」を理解するということです。これは、数学の世界でも変わりありません。「基礎解析学・線形代数学・確率統計学」は、機械学習に深く関連する分野であると同時に、理工系の大学1、2年生が学ぶ数学の基礎、言うなれば、大学レベルの本格的な数学への入り口ともなる領域です。本書を含む3部作を通して、直感的な理解にとどまらない、「厳密な数学」の世界をあらためて振り返り、じっくりと味わっていただければ幸いです。あるいはまた、受験勉強から解放されて、あこがれの大学数学の教科書を開いたあのときの興奮をわずかなりとも思い出していただければ、筆者にとってこの上ない喜びです。

各章の概要

第1章 確率空間と確率変数
確率統計学の基礎となる「確率モデル」の考え方を説明した上で、確率モデルを数学的に表現する確率空間を定義します。さらに、離散的な確率空間を用いて、条件付き確率などの確率に関する基本計算、そして、確率変数と確率分布の考え方を説明します。確率空間の理論的な理解を深めることを念頭に置き、事象の独立性など、感覚的な理解にとどまりがちな内容についても、定義にもとづいた厳密な導出を行ないます。

第2章 離散型の確率分布
「根元事象に伴う数値データ」として確率変数をとらえた場合、確率変数の特徴を通して、その背後にある確率的な事象の性質を把握することが確率統計学の1つの目標となります。ここでは、確率変数の特徴を把握する道具として、期待値・分散・相関係数などの計算方法を説明します。また、二項分布やポアソン分布など、主要な確率分布の性質を紹介し、さらに、有限個の観測データから背後の確率分布を推測するという、モデル推定の考え方を大数の法則を通して説明します。

第3章 連続型の確率分布
現実世界で観測される現象には、実数値全体など、連続的な値を取るものがあり、このような現象を確率変数で表わすには、標本空間が非可算無限集合となる、連続的確率空間が必要となります。本章では、このような連続的確率空間、および、連続型の確率変数を取り扱います。また、連続型の確率変数の代表とも言える正規分布について、確率密度関数の一般形を導き、その基本的な性質を説明します。

第4章 パラメトリック推定と仮説検定
前章までは、確率空間にもとづいて、現実世界で発生する事象の確率を計算する手法を説明してきました。ここでは、逆に、現実世界の観測データを用いて、それに適合する確率モデルを構成する手法であるパラメトリック推定、さらには、自分が構成した確率モデルを観測データに照らし合わせて、そのモデルを受け入れるかどうかを判定する手続きである仮説検定について説明します。

付録A 機械学習への応用例
本書は、先に出版された『技術者のための基礎解析学』『技術者のための線形代数学』の姉妹編となっており、この3冊を通じて、基礎解析学、線形代数学、そして、確率統計学の3つの分野を学べるように編纂されています。そして、これらを総合した応用分野の1つに機械学習があります。ここでは、これら3部作のまとめとして、機械学習の基礎的なアルゴリズムについて、その原理を数学的な観点から解説します。

*1:いやもう、なんかいろいろ救われました。ありがとうございます。