再生核方法-第四章 算子的应用
再生核方法-第四章 算子的应用
一般非线性回归的变量选择
考虑模型
其中,中来自于一个对称正定核诱导出的再生核希尔伯特空间。定义偏导函数的范数
在一定条件下,有关于是常数。
的样本版本为
其中表示关于第个分量的偏导数。
我们考虑如下最小化如下正则化的泛函来求解函数,并实现变量选择,
添加项是为了泛函的强凸性,从而保证解的唯一性,也保证算法的稳定性。
推导新的表示定理
由核函数的再生性可得,对
定义抽样算子,它输出一个函数在样本点的取值,即
如果核函数有界,则该算子是线性且有界的(见参考文献)。由定义和再生性可知:
下面介绍一下再生核理论如何实现导数的有效计算。记核函数关于第一个变量的偏导数为
根据Zhou(2008)中定理1有:如果为至少二次可微函数(),则对有并且对于
于是,关于导数可以定义类似的抽样算子:
进一步,定义经验梯度算子:. 在一定条件下,可以证明这些算子都是线性且有界的。
记,则根据算子定义,可以重写成:
其中。于是,泛函关于的导数为
其中为的伴随算子。
对于任意算子,定义它的值空间(也叫Range空间)为:
定义它的零空间(也叫kernel空间)为:
新表示定理的证明:因为(此处加号指两个集合的并)是的一个闭子空间,于是对任意函数存在存在正交分解:,其中,而. 将该分解代入,分别考察目标函数中每一项与分解的依赖关系。第一项只通过与产生关系,有
本内容参考文献:
Rosasco, et al., Nonparameteric Sparsity and Regularization, 2013, JMLR.