目的
Latent variable を持つ確率分布 について、
を極大にする を求めること。
説明
より、
任意の確率分布 を両辺に掛けて、 の和をとると下記が証明される。
―― (1)
ここに、
ここで、 は、Kullback-Leibler divergence なので、、かつ、
(すなわち、 が の事後分布に一致する)の時に、 となる。
そこで、ある固定した に対して、
を計算しておき、この の下で (1) を使って、 と を比較する。
まず、
同じく、
ここに、
従って、 に注意すると、次の関係が得られる。
EM Algorithm
以上をまとめると、
の下に、
を最大化する を求めることで、
が成立する。そこで、 を新たに として上記の計算を繰り返すことで、 を極大にする が得られる。