一般形式:
∫−∞∞p(x)dxE(fj(x))H(x)J(p(x))∂p(x)∂Jp(x)======1∫−∞∞fj(x)p(x)dx=aj−∫−∞∞p(x)lnp(x)dx−∫−∞∞p(x)lnp(x)dx+λ0(∫−∞∞p(x)dx−1)+∑jλj(∫−∞∞fj(x)p(x)dx−aj)−lnp(x)−1+λ0+∑jλjfj(x)=0e−1+λ0e∑jλjfj(x) 看最后一个式子的形式,指数分布族。目前之前只知道,指数分布族在理论上一定有共轭先验。
Γ(x)ψ(x)B(p,q)γEEuler’s constant===∫0+∞e−ttx−1dt(x>0)=(x−1)!这是Gamma函数,不是Gamma分布dxdlnΓ(x)=Γ(x)Γ′(x)digamma functionΓ(p+q)Γ(p)Γ(q)beta function 给定前k阶矩的最大熵分布是什么?
有人思考过对一阶矩和二阶矩的限制是自然的吗?
为什么正态分布在自然界如此常见?
Central limit theorem
正态分布
是否许多变量可以用正态分布很好地描述? 同样过过程,只不过是用了变分法。
变分法简介 最后一部分
gamma
约束条件(即均值和几何平均值)
∫−∞∞p(x)dx=1E(x)=kθE(ln(x))=ψ(k)+ln(θ) 用乘子法构造拉格朗日函数去最大化熵
J(p(x))=−∫−∞∞p(x)lnp(x)dx+λ0(∫−∞∞p(x)dx−1)+λ1(∫−∞∞p(x)xdx−k)+λ2(∫−∞∞p(x)ln(x)dx−ψ(k)−ln(θ))∂p(x)∂J=−lnp(x)−1+λ0+λ1x+λ2ln(x)=0p(x)=exp(λ0−1+λ1x+λ2ln(x))=eλ0−1xλ2eλ1x 或者用变分原理+乘子法
δ(H(p(x)))+δλ0(∫−∞∞p(x)dx)+δλ1(∫−∞∞p(x)xdx)+δλ2(∫−∞∞p(x)ln(x)dx)=0p(x)=exp(λ0−1+λ1x+λ2ln(x))=eλ0−1xλ2eλ1x 求解
∫0∞xne−axdx=an+1n!∫−∞∞p(x)dx=1⇒eλ0−1=Γ(λ2+1)(λ0−1)λ2+1 最后得:
p(x)=θkΓ(k)1xk−1e−θx实在是凑不出来θ power-law
幂率是几何平均约束下的最大熵分布
1=∫xmin∞p(x)dx=∫xmin∞x−adx=1−aC[x−a+1]xmin∞a>1C=(a−1)xxmin∞p(x)=xmina−1(xminx)−a 几何平均值
离散:几何平均值m的含义是N个个体的变量x的连续乘积再开N次方
mn=x1n1⋅x2n2⋅…⋅xnnnNlnm=n1lnx1+n2lnx2+…+nnlnxn=∑njlnxj 连续:
lnm=∫abp(x)lnxdx 构造拉格朗日函数
F=−∫p(x)lnp(x)dx+λ0(∫p(x)dx−1)+λ1(∫p(x)lnxdx−lnm)∂p(x)∂J=−lnp(x)−1+λ0+λ1ln(x)=0p(x)=e−1+λ0xλ1 Power law
人类行为服从的幂律分布是否违背了中心极限定理?
人类行为时空特性的统计力学(一)——认识幂律分布
参考佳文
Maximum entropy probability distribution
Exponential family
张学文的《组成论》 190页