MATH-probability

概率和统计可视化arrow-up-right

测度论观点下的初等概率论与随机过程arrow-up-right

基本概率知识汇总表arrow-up-right

http://www.math.wm.edu/~leemis/2008amstat.pdfarrow-up-right 《Univariate Distribution Relationships》 各种概率分布之间的关系

http://www.math.wm.edu/~leemis/chart/UDR/UDR.htmlarrow-up-right 鼠标放上去会高亮关系

几何分布与负二项分布的关系arrow-up-right

服从二项分布的随机变量取何值时概率最大arrow-up-right

一张图说明二项分布、泊松分布、指数分布、几何分布、负二项分布、伽玛分布的联系arrow-up-right

二项分布与泊松分布arrow-up-right

泊松分布 (Poisson Distributions) 的推导arrow-up-right

poisson 分布是二项分布的的一种极限,高斯分布也是一种二项分布的极限,那么他们之间?

当n逐渐趋于无穷时,二项分布B(n,p)是趋于正态分布还是泊松分布?arrow-up-right

分布是泊松分布的“逆分布”。泊松分布是给定概率λ\lambda和等待时间T,算在此时间内事件发生的次数k的分布;而Gamma则是反过来,给定概率λ\lambda和发生次数k,算等待时间T的分布。很显然,T的平均值就是k/λ\lambda 。这样的Gamma分布写作:Gamma(k, λ\lambda)

指数分布是泊松过程的事件间隔的分布。指数分布的λ\lambda跟泊松分布中的λ\lambda意义一样。

泊松过程的一些总结arrow-up-right

大数定律与中心极限定理

大数定律说的是随机现象平均结果稳定性。

中心极限定理论证随机变量的和的极限分布是正态分布。

https://www.zhihu.com/question/22913867arrow-up-right

最大似然估计MLE和最大后验概率MAP

极大似然估计和贝叶斯估计分别代表了频率派和贝叶斯派的观点。频率派认为,参数是客观存在的,只是未知而矣。因此,频率派最关心极大似然函数,只要参数求出来了,给定自变量X,Y也就固定了,极大似然估计如下所示:

θ=argmaxθp(Dθ)D表示训练数据集,θ是模型参数\theta = \arg \max_{\theta} p(D|\theta) \\ \text{D表示训练数据集,}\theta\text{是模型参数}

相反的,贝叶斯派认为参数也是随机的,和一般随机变量没有本质区别,正是因为参数不能固定,当给定一个输入x后,我们不能用一个确定的y表示输出结果,必须用一个概率的方式表达出来,所以贝叶斯学派的预测值是一个期望值,如下所示:

E[yx,D]=p(yx,θ)p(θD)dθE[y|x,D] = \int p(y|x,\theta)p(\theta|D)d\theta

该公式称为全贝叶斯预测。现在的问题是如何求p(θD)p(\theta|D)(后验概率),根据贝叶斯公式我们有:

p(θD)=p(Dθ)p(θ)p(D)=p(Dθ)p(θ)p(Dθ)p(θ)dθp(\theta|D) = \frac {p(D|\theta)p(\theta)}{p(D)} = \frac {p(D|\theta)p(\theta)}{\int p(D|\theta)p(\theta)d\theta}

可惜的是,上面的后验概率通常是很难计算的,因为要对所有的参数进行积分,不能找到一个典型的闭合解(解析解)。在这种情况下,我们采用了一种近似的方法求后验概率,这就是最大后验概率

θ=argmaxθp(Dθ)p(θ)\theta = \arg \max_{\theta} p(D|\theta)p(\theta)

最大后验概率和极大似然估计很像,只是多了一项先验分布,它体现了贝叶斯认为参数也是随机变量的观点,在实际运算中通常通过超参数给出先验分布。 从以上可以看出,一方面,极大似然估计和最大后验概率都是参数的点估计。在频率学派中,参数固定了,预测值也就固定了。最大后验概率是贝叶斯学派的一种近似手段,因为完全贝叶斯估计不一定可行。另一方面,最大后验概率可以看作是对先验和MLE的一种折衷,如果数据量足够大,最大后验概率和最大似然估计趋向于一致,如果数据为0,最大后验仅由先验决定。 最大似然估计和最大后验概率arrow-up-right

生成模型使用联合概率建模,判别模型直接使用条件概率建模

待深入

https://wenku.baidu.com/view/29ca0de56bd97f192379e9c7.htmlarrow-up-right 概率论与数理统计公式整理(完整版)

漫谈概率论arrow-up-right 此文要多看,多看,多看

Statistical Rethinking统计反思arrow-up-right YouTube上有视频课程

机器学习的数学基础-(三、概率论和数理统计)arrow-up-right 大数定律与中心极限定理arrow-up-right 平均值和数学期望有多近arrow-up-right 怎样理解和区分中心极限定理与大数定律?arrow-up-right 强大数定律和弱大数定律的本质区别?arrow-up-right

如何理解指数分布的无记忆性?arrow-up-right

从西格玛代数、测度空间到随机变量arrow-up-right

Fundamental Principles of Statistics 统计学基本原则arrow-up-right

Probabilistic Models of ,Cognition

The Algorithms Behind Probabilistic Programmingarrow-up-right

泊松分布的现实意义是什么,为什么现实生活多数服从于泊松分布?arrow-up-right

二项分布与泊松分布arrow-up-right

想了解概率图模型?你要先理解图论的基本定义与形式arrow-up-right

正态分布随机变量的和还是正态分布arrow-up-right 用卷积得到

统计知识思维导图arrow-up-right

The probability and statistics cookbookarrow-up-right 重要

掌握机器学习数学基础之概率统计arrow-up-right

从贝叶斯定理到概率分布:综述概率论基本定义arrow-up-right

Last updated

Was this helpful?