Gaussian Process
Last updated
Last updated
如同Dirichlet过程采样产生的都是符合Dirichlet分布,高斯过程采样产生的都是符合高斯分布,即: 。
假设真实的target符合: 。
是随机噪声变量,且对于每个观测n都是独立的,假设服从高斯分布,则:
则的边缘分布。 其中协方差矩阵C的元素为: 。
这个结果反映了下面的事实:两个随机的高斯分布(即与相关的和与相关的高斯分布)是独立的,因此它们的协方差可以简单地相加。
广泛选择的核函数:
现在假设有N个训练集,并且要预测第N+1个数据x对于的y。 先求n+1联合分布: 将协方差矩阵分块:\begin{eqnarray} C_{N+1} = \left( \begin{array}{cc} C_N & k \\ k^T & c \end{array} \right) \end{eqnarray} , 则可以得到 的均值和协方差分别为:
最后得到: 。
高斯过程和很多模型是等价的:ARMA (autoregressive moving average) models, Kalman filters, radial basis function networks 。
https://www.zhihu.com/question/54354940
什么是Gaussian process? —— 说说高斯过程与高斯分布的关系
Gaussian process regression的导出——权重空间视角下的贝叶斯的方法
高斯过程初探 说说高斯过程回归 需梯子, 说说高斯过程回归 高斯过程-线性回归 高斯过程回归 A Python implementation of global optimization with gaussian processes.
Small tutorial on using Gaussian processes for Bayesian optimization
Gaussian Process and Uncertainty Quantification Summer School, 2017
多维高斯分布由均值(向量)和协方差(矩阵)决定,那么高斯过程的均值和协方差由mean function和covariance function决定。形式如下:
对于任意时刻,高斯过程的任意n维随机变量都服从高斯分布,那么就可以用来做贝叶斯推断的先验(一些模型都会增加正太分布先验(L2正则项)),这样就可以非参数贝叶斯估计。