首页 理论教育 常见的函数型聚类分析方法

常见的函数型聚类分析方法

时间:2023-06-09 理论教育 版权反馈
【摘要】:本章将从函数型数据的相似性度量的角度出发,研究函数型聚类分析。(一)基于基函数距离的函数型聚类分析方法基于基函数的距离度量,出于计算的方便,在实际中最常使用的是函数型曼哈顿距离、函数型欧氏距离以及函数型余弦距离。

常见的函数型聚类分析方法

函数型数据聚类分析方法的基本思想与传统聚类分析方法一样,分析的关键在于对样本对象亲疏程度的测度方法。传统聚类分析中数据是离散点,主要利用点间的性质来衡量亲疏程度,而在函数型数据分析中,对象是连续的函数,因此需要转换角度,从函数的角度来测度相似性。本章将从函数型数据的相似性度量的角度出发,研究函数型聚类分析。

根据曲线的相似性测度不同,函数型聚类分析方法主要可以分为基于数值距离的函数型聚类分析方法和基于曲线形态模式的函数型聚类分析方法。

一、基于数值距离的函数型聚类分析方法

在传统的聚类分析中,距离度量是最常用的相似性度量方式,常用的距离度量方式有闵科夫斯基距离(绝对距离、欧氏距离)、余弦距离、马氏距离等。而函数型聚类分析中距离的计算方式主要有两种方式:一是直接将传统距离计算方式衍生至函数型数据,直接作为相似性度量;另一种方式是使用基函数展开系数代替函数型数据进行距离度量。

(一)基于基函数距离的函数型聚类分析方法

基于基函数的距离度量,出于计算的方便,在实际中最常使用的是函数型曼哈顿距离、函数型欧氏距离以及函数型余弦距离。记

1.函数型曼哈顿距离(www.xing528.com)

曼哈顿距离又称绝对距离,在传统离散的面板数据分析中代表多维空间中点间的折线距离,而在函数型数据下代表的是曲线之间构成的面积,比较具有现实意义。

2.函数型欧氏距离

欧式距离在传统离散的面板数据分析中代表多维空间中点间的几何距离,而在函数型数据下欧氏距离的平方值代表的是曲线偏移量曲线xi(t)-xj(t)围绕时间轴(t轴)旋转的图形的体积的1/π,即

3.函数型余弦距离

(二)基于基函数展开系数距离的函数型聚类分析方法

基于基函数展开系数的距离度量的核心思想是在确定基函数之后,原函数将与基函数展开系数一一对应,因此能够利用基函数展开系数之间的相似性来表示原函数之间的相似性。利用基函数的特性从而将连续的函数聚类转化为简单的离散向量聚类,这样聚类的计算过程将会大幅度的简化。根据基函数展开系数估计的过程中系数是否可变可以分为两步法串联聚类以及自适应模型聚类(王德青,2018)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈