読者です 読者をやめる 読者になる 読者になる

めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

モンティ・ホール問題をまじめに計算してみる

普通のモンティ・ホール問題

[問題]

「プレイヤーの前に3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろにはヤギ(はずれを意味する)がいる。プレイヤーは新車のドアを当てると新車がもらえる。プレイヤーがドア1を選択した所、モンティはドア3を開けてヤギを見せた。

ここでプレイヤーは、ドア2に選択を変更しても良いと言われる。プレイヤーはドアを変更すべきだろうか?」

前提を厳密に規定するために、モンティの行動に規定を設ける。

・プレイヤーがヤギを選んだ場合、モンティは残りのヤギのドアを開ける。
・プレイヤーが新車を選んだ場合、モンティはどちらかのヤギのドアを1/2の確率で選んで開ける。

[解答]

・アンサンブル

W = \left\{A_1,\,A_2,\,A_3\right\}

ここに、A_nは「ドアnに新車が入っている(他のドアには新車が入ってない)状態」

・アンサンブルの事前分布

P(A_1)=\frac{1}{3},\,P(A_2)=\frac{1}{3},\,P(A_3)=\frac{1}{3}

・観測事象(Evidence)

E = 「ドア1を指定したら、モンティはドア3を開けて、そこに新車はなかった」

以上の前提でいくつか計算する。

・サンプルが決まった前提で観測事象が発生する確率:

P(E|A_1) = \frac{1}{2}

→ モンティはドア2もしくはドア3のどちらかを1/2の確率で開けるので、ドア3が開く確率は1/2。

P(E|A_2) = 1

→ モンティは必ずドア3を開けるので、ドア3が開く確率は1。

P(E|A_3) = 0

→ モンティは必ずドア2を開けるので、ドア3が開く確率は0。

・観測事象が発生する総確率

P(E) = \sum_{n=1}^{3}P(E|A_n)P(A_n)=\frac{1}{2}

・観測事象の下でのアンサンブルの事後分布

P(A_1|E) = \frac{P(E|A_1)P(A_1)}{P(E)} = \frac{1}{3}

P(A_2|E) = \frac{P(E|A_2)P(A_2)}{P(E)} = \frac{2}{3}

P(A_3|E) = \frac{P(E|A_3)P(A_3)}{P(E)} = 0

というわけで、最初の選択が正解する確率は1/3に対して、選択を変えた場合の正解確率は2/3。

モンティ・ホール問題の変形版

[問題]

「プレイヤーの前に3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろにはヤギ(はずれを意味する)がいる。プレイヤーは新車のドアを当てると新車がもらえる。プレイヤーがドア1を選択した所、

地震が発生して、ドア3が勝手に開いて、ヤギが見えてしまった!

ここでプレイヤーは、ドア2に選択を変更しても良いと言われる。プレイヤーはドアを変更すべきだろうか?」

前提を厳密に規定するために、地震の影響に前提を設ける。

・地震によって、ドア2かドア3のどちらか1つが必ず開く。どちらが開くかは、それぞれ確率1/2。
→普通の問題と対比するために、あえて、ドア1が開く可能性は除外しています。

[解答]

・アンサンブル

W = \left\{A_1,\,A_2,\,A_3\right\}

ここに、A_nは「ドアnに新車が入っている(他のドアには新車が入ってない)状態」

・アンサンブルの事前分布

P(A_1)=\frac{1}{3},\,P(A_2)=\frac{1}{3},\,P(A_3)=\frac{1}{3}

・観測事象(Evidence)

E = 「ドア1を指定したら、地震でドア3が開いて、そこに新車はなかった」

以上の前提でいくつか計算する。

・サンプルが決まった前提で観測事象が発生する確率:

P(E|A_1) = \frac{1}{2}

→ ドア3が開く確率は1/2。

P(E|A_2) = \frac{1}{2}

→ ドア3が開く確率は1/2。

P(E|A_3) = 0

→ ドア3が開く確率は1/2。ただし実際に開いたら新車が見えるので観測事象には一致しない。つまり観測事象が起きる確率は0。

・観測事象が発生する総確率

P(E) = \sum_{n=1}^{3}P(E|A_n)P(A_n)=\frac{1}{3}

※地震の場合は、正解のドアが開いてゲームが台無しになる可能性が加わるので、観測事象(無事にゲームが継続する)が起きる確率は、モンティがドアを開く場合よりも小さくなる。

・観測事象の下でのアンサンブルの事後分布

P(A_1|E) = \frac{P(E|A_1)P(A_1)}{P(E)} = \frac{1}{2}

P(A_2|E) = \frac{P(E|A_2)P(A_2)}{P(E)} = \frac{1}{2}

P(A_3|E) = \frac{P(E|A_3)P(A_3)}{P(E)} = 0

とうわけで、最初の選択でも、選択を変えた場合でも、正解確率は同じ1/2。