目的
Latent variable を持つ確率分布
について、
を極大にする を求めること。
説明
より、
任意の確率分布 を両辺に掛けて、
の和をとると下記が証明される。
―― (1)
ここに、
ここで、 は、Kullback-Leibler divergence なので、
、かつ、
(すなわち、
が
の事後分布に一致する)の時に、
となる。
そこで、ある固定した に対して、
を計算しておき、この の下で (1) を使って、
と
を比較する。
まず、
同じく、
ここに、
従って、 に注意すると、次の関係が得られる。
EM Algorithm
以上をまとめると、
の下に、
を最大化する を求めることで、
が成立する。そこで、 を新たに
として上記の計算を繰り返すことで、
を極大にする
が得られる。