首页 理论教育 投影寻踪聚类模型的三个主要研究内容

投影寻踪聚类模型的三个主要研究内容

时间:2023-07-02 理论教育 版权反馈
【摘要】:投影寻踪聚类模型就是依据投影寻踪理论建立的综合评价模型,投影寻踪聚类模型研究包括以下三方面的主要内容。虽然上述的取值方法在实际应用中都取得了较为满意的效果,但始终缺乏理论依据,为了投影寻踪聚类模型的应用和推广,十分有必要进行深入研究,使之更加完善。

投影寻踪聚类模型的三个主要研究内容

投影寻踪聚类模型就是依据投影寻踪理论建立的综合评价模型,投影寻踪聚类模型研究包括以下三方面的主要内容。

1.构造投影指标

这是投影寻踪聚类分析中最为关键的一步,高维数据向低维空间的投影规则就是通过这一投影指标来反映,同时分类准则和思想也是通过投影指标来体现,因此,只有构造合理的、反映分类特性的投影指标才能取得科学的分类结果。由于聚类分析实际上就是按照数据样本自身的结构特性或一定的参照标准对分析样本进行合理的分类,目前关于投影指标的构造都是按照分类的思想来进行设计,如文献[1]采用标准差和核密度来构造投影指标函数,这也是目前较为普遍采用的一种方法。当然,也可以根据具体问题进行灵活构造,如金菊良等采用标准差和相关系数来构造投影指标的方法,并在应用中取得了满意的效果[153]。总之,投影指标的构造并没有固定的形式和标准,在应用中可以根据具体问题灵活选择,但必须强调的是,所构造的投影指标必须能够反映分析问题的特性,以达到对数据样本进行合理聚类的目的。

2.确定密度窗宽(www.xing528.com)

当采用标准差和核密度来构造投影指标函数时,投影寻踪聚类模型中唯一的参数便是密度窗宽,它的选取既要使包含在视窗内的样本点个数不能太少,以免样本滑动平均时的偏差太大,同时也不能使它随样本数目的增大而增加太大[1]。目前还没有关于此值选定的理论和计算方法,Friedman等建议此参数的取值为投影样本方差的10%[1],作者则是通过多个的取值进行试算后确定[197]。虽然上述的取值方法在实际应用中都取得了较为满意的效果,但始终缺乏理论依据,为了投影寻踪聚类模型的应用和推广,十分有必要进行深入研究,使之更加完善。

3.选择投影方向优化方法

投影寻踪聚类分析,实质上就是根据设计的投影指标,并在相关约束条件下进行的优化问题。理论上一切优化的方法都可以实现投影方向的优化,然而,传统的优化方法往往需要目标函数具有连续、可导的特性,这无疑增大了投影指标构造的难度,必然限制其发展。作者提出应用遗传算法来实现投影寻踪聚类的优化,巧妙的克服了传统优化方法的缺点,而且实现过程更为简单,是对投影寻踪聚类方法的重大突破[197]。使得投影寻踪聚类技术更便于实际操作应用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈