【摘要】:在聚类准则最优的情况下,可以求得软划分矩阵和聚类中心,当b>1和Uk≠Vi时,可用下面的公式求aij和Vi:具体计算步骤如下:第一步:给出初始划分A;第二步:按照式计算聚类中心Vi(i=1,2,…
设有n个样本,记为,要将它们分成m类,这一过程相当于求一个划分矩阵,其中
矩阵A称作样本集U的一个划分,显然不同的A对应样本集U上不同的划分,不同的A会给出了不同的分类结果。把对样本集U的所有划分称作U的划分空间,记为M。这样聚类过程就是从样本集U的划分空间M中找出最佳划分矩阵的过程。
在实际问题中,确定样本归属的问题存在一定的模糊性,因此分类矩阵一般是一个模糊矩阵,即满足以下条件:
(1)aij[0,1],它表示样本U属于第i类的隶属度。
(2)A中每列元素之和为1,即一个样本对各类的隶属度之和为1。
(3)A中每行元素之和大于0,即表示每类不为空集。
以模糊矩阵A对样本集U进行分类的过程称作软分类。为了得到合理的软分类,定义聚类准则如下:
式中:A为软分类矩阵;V表示聚类中心;m为类别数;n为样本数,表示样本Uj到第i类的聚类中心Vi的距离(如欧氏距离等等);b为权系数,b值越大,分类越模糊,一般情况下b≥1,当b=1时就是硬分类。(www.xing528.com)
在聚类准则最优的情况下,可以求得软划分矩阵和聚类中心,当b>1和Uk≠Vi时,可用下面的公式求aij和Vi:
具体计算步骤如下:
第一步:给出初始划分A;
第二步:按照(10-2)式计算聚类中心Vi(i=1,2,…,m)。
第三步:根据Vi和(10-1)式计算出新的分类矩阵A*。
第四步:如果小于某一阈值,则A*和V即为所求。否则转到第二步,继续进行迭代处理。
第五步:以模糊矩阵A*为基础对样本集U中的样本进行分类。方法之一就是将分到A*的第j列中数值最大的元素所对应的类别中去。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。