未知のパラメーターθを持つ確率モデル p(t|θ) において、独立試行サンプル を元にした事後分布 p(θ|D) を求めた後、事後分布の重みで周辺化した確率(次式)を計算して、これを事象tの予測モデルとすることがあります。
一方、パラメーターθを導入せずに、サンプル事象による条件付き確率(次式)を直接に計算して、事象tの予測モデルとする事も可能です。
この2つにはどのような関係があるのでしょうか? 先に「独立試行サンプル」と表現したように、各サンプルの取得が独立事象である場合、つまり、次式が成立する場合に、上記の2つは同じものになります。
(証明)
一般的なsum ruleより、
ここで、
(∵ 独立試行の仮定)
これを上記に代入して、