一般介绍最大熵的文章都会IIS。凸优化中迭代方法有很多,目前收敛速度比较快的是拟牛顿法,常用L-BFGS,没必要用IIS,但是IIS的思想可以学习学习。
Lp(Pw)=logx,y∏P(y∣x)P(x,y)=x,y∑P(x,y)logP(y∣x)=x,y∑P(x,y)log(exp(i=1∑nwifi(x,y))/Zw(x))=x,y∑P(x,y)i=1∑nwifi(x,y)−x∑P(x)logZw(x) L(w+δ)−L(w)=x,y∑P(x,y)i=1∑nδifi(x,y)−x∑P(x)log(Zw+δ(x)/Zw(x))≥x,y∑P(x,y)i=1∑nδifi(x,y)+x∑P(x)(1−Zw+δ(x)/Zw(x))∵(−logx≥1−x)=x,y∑P(x,y)i=1∑nδifi(x,y)+1−x∑P(x)(Zw+δ(x)/Zw(x))=x,y∑P(x,y)i=1∑nδifi(x,y)+1−x∑P(x)y∑Pw(y∣x)exp(i=1∑nδifi(x,y)) 令f#(x,y)=i=1∑nfi(x,y)exp(i=1∑nδifi(x,y))=exp(i=1∑nf#(x,y)fi(x,y)δif#(x,y))≤i=1∑nf#(x,y)fi(x,y)exp(δif#(x,y)) L(w+δ)−L(w)≥x,y∑P(x,y)i=1∑nδifi(x,y)+1−x∑P(x)y∑Pw(y∣x)i=1∑nf#(x,y)fi(x,y)exp(δif#(x,y))