高斯过程回归预测
如同Dirichlet过程采样产生的都是符合Dirichlet分布,高斯过程采样产生的都是符合高斯分布,即:p(y)=N(y∣0,K) 。
假设真实的target符合:tn=yn+ϵ 。
ϵ是随机噪声变量,且对于每个观测n都是独立的,假设服从高斯分布,则:
p(tn∣yn)=N(tn∣yn,β−1)p(t∣y)=N(t∣y,β−1IN) 则p(t)的边缘分布p(t)=∫p(t∣y)p(y)dy=N(t∣O,C)。
其中协方差矩阵C的元素为:C(xn,xm)=k(xn,xm)+β−1δnm 。
这个结果反映了下面的事实:两个随机的高斯分布(即与y(x)相关的和与ϵ相关的高斯分布)是独立的,因此它们的协方差可以简单地相加。
广泛选择的核函数:k(xn,xm)=θ0exp{−2θ1∥xn−xm∥2}+θ2+θ3xnTxm
现在假设有N个训练集,并且要预测第N+1个数据x对于的y。
先求n+1联合分布:p(tN+1)=N(tN+1∣O,CN+1)
将协方差矩阵分块:\begin{eqnarray} C_{N+1} = \left( \begin{array}{cc} C_N & k \\ k^T & c \end{array} \right) \end{eqnarray} , 则可以得到 P(tN+1∣t) 的均值和协方差分别为:
\begin{eqnarray}
m(x_{N+1}) &=& k^TC_N^{-1}t \\
\sigma^2(x_{N+1}) &=& c - k^TC_N^{-1}k
\end{eqnarray}
最后得到:p(xN+1)=N(xN+1∣kTCN−1t,c−kTCN−1k) 。
高斯过程和很多模型是等价的:ARMA (autoregressive moving average) models, Kalman filters, radial basis function networks 。
参考佳文