【摘要】:在本节提出了一种最大非参类间距投影的数据维数约减方法,实现从高维数据中提取判别特征。在MNMP方法中,首先利用样本数据的类别信息和局部结构信息,从多流形局部学习的角度定义了一种非参类间散度矩阵和非参类内散度矩阵。另一方面所定义的非参类间距准则表示了不同类数据之间的最小间距,基于原始高维数据多流形分布的前提,非参类间距准则可以用来度量多流形之间的相似度。
在本节提出了一种最大非参类间距投影的数据维数约减方法,实现从高维数据中提取判别特征。在MNMP方法中,首先利用样本数据的类别信息和局部结构信息,从多流形局部学习的角度定义了一种非参类间散度矩阵和非参类内散度矩阵。同其他一些基于LDA的数据维数约减方法项比较,从局部学习所定义的有关非参矩阵模型既能够对高斯分布的数据进行学习,也能完成对非高斯分布数据的学习。另外基于非参类间散度矩阵和非参类内散度矩阵,定义了非参类间距准则度量异类样本之间的可分离程度。一方面该非参类间距准则度量所呈现的是一种差值形式,因此无论被减散度矩阵是否正定,都不影响基于非参类间距准则度量的求解,自然而然地避免了小样本问题。另一方面所定义的非参类间距准则表示了不同类数据之间的最小间距,基于原始高维数据多流形分布的前提,非参类间距准则可以用来度量多流形之间的相似度。另外相对于另外一种非参类间距准则(Nonparametric Maximum Marginal Criterion,NMMC),MNMP和NMMC的相同点都在于从多流形局部学习来定义非参类间距准则,不同点在于MNMP方法中采用同类近邻点和异类近邻点来计算非参类间距准则,其中针对每一个样本点,构建局部邻域非参类间散度矩阵和非参类内散度矩阵时分别采用异类近邻点的均值和同类近邻点的均值进行计算,而NMMC在构建局部非参类间散度矩阵非参类内散度矩阵时采用异类最近的点和同类最近的点进行计算。相对于NMMC、MNMP方法在计算过程中利用了近邻点的均值,能够有效地抑制噪声数据对多流形判别学习的影响,提高算法的鲁棒性能。(www.xing528.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。