Dirichlet分布

dirichlet 分布

它是关于多项分布的分布。从 $Dir(\alpha,K)$ 分布中每次抽样，得到的都是一个K维随机向量，且是一个离散分布。

举个例子：一堆骰子，不全相同，即每个骰子摇出的点数都是一个分布。现在问，这个分布的分布是多少，即每种骰子的分布。

$\alpha$ 是concentration parameter，控制Dirichlet分布的形状，或者说，是控制不同多项分布的概率密度（注意：这里的随机变量是抽出的多项分布）。 $\alpha$ 的具体作用，可以根据Dirichlet分布的密度函数推导，但更直观的方法是利用Polya urn模型：

假设一个盒子里最初有K种颜色的球各 $\alpha$ 个（应作推广理解： $\alpha$ 可取任意正实数），每一次，从盒中随机取出一个球（在推广情形下，就是按盒中球数的分布选取一种颜色），把球放回，并且再向盒子中放进一个同样颜色的球。进行同样的操作N次，当N趋于无穷时，盒子中不同颜色的球数分布（K项分布）就服从Dirichlet分布。

$\alpha$ 到底有什么作用？试试把 $\alpha$ 分别设成0.01, 1, 100，自己模拟一下就会明白了。

dirichlet.pdf 这个pdf上写的很清楚，就不照抄了