Professional Documents
Culture Documents
onals in LDA
¬a,b ¬a,b
将位置在(a, b)的词去掉之后统计Nd,k 和Nk,v 都是固定的值,不不会随i的值变化⽽而变
化。所以可以消去常数项得到下⾯面简化的结果。
d,k≠a,i k,v≠i,j
¬a,b ¬a,b
= (θa,i × ) × (ϕi,j × )
αk −1+Nd,k βv −1+Nk,v
∏ ∏θd,k ∏ ∏ϕk,v
d k k v
∝ θa,i × ϕi,j
除了了上⾯面的推导,还可以下⾯面的⽅方法得到同样的结论。根据Markov Blanket可知,zd,n 只
依赖于wd,n , θd , ϕzd,n 。
p(za,b = i∣Z¬a,b , wa,b = j, W¬a,b , Θ, Φ, α, β)
= p(za,b = i∣wa,b = j, θa , ϕza,b )
∝ p(za,b = i, wa,b = j, θa , ϕza,b )
= p(za,b = i, wa,b = j, θa , ϕi )
= p(za,b = i∣θd )p(θa )p(wa,b = j∣ϕi )p(ϕi )
K K V V
Γ(∑k=1 αk ) Γ(∑v=1 βv )
∏ θa,k ∏ ϕi,vv
αk −1 β −1
= θa,i × K × ϕi,j × V
∏k=1 Γ(αk ) k=1 ∏v=1 Γ(βv ) v=1
Γ(∑K αk ) K αk −1 Γ(∑Vv=1 βv ) V β −1
上⾯面表达式中所有的 ∏K k=1 ∏k=1 θa,k 以及 ∏V Γ(βv ) ∏v=1 ϕi,vv 都是固定的
k=1 Γ(αk ) v=1
值,不不会随i的值不不同⽽而变化,所以可以消去之后同样得到最后简化的结果。
前⾯面推导过程中有
⽽而根据条件概率的定义
p(za,b = i∣wa,b = j, θa , ϕi )
p(za,b = i, wa,b = j, θa , ϕi )
= K
∑i=1 p(za,b = i, wa,b = j, θa , ϕi )
θa,i × ϕi,j
= K
∑i=1 θa,i × ϕi,j
Notes:
在上⾯面的表达式中wa,b = j 是固定的已观测的值,所以p(za,b = i, wa,b = j∣θa , ϕi )和
p(za,b = i∣wa,b = j, θa , ϕi )没有区别。
以及
在LDA⽤用Gibbs Sampling的简明推导中,已经得出