首页 理论教育 分类关联规则

分类关联规则

时间:2023-06-24 理论教育 版权反馈
【摘要】:关联规则的应用范围越来越广泛,根据不同的标准可将关联规则进行以下分类:基于规则中处理的数据的类型。定义3.11:描述离散属性之间关系的关联规则称为布尔关联规则。例如:性别=“女”平均收入=2300,是一个量化型关联规则,涉及的“平均收入”属性是数值型。量化关联规则中也可能包含类别型属性,如厂名、品牌等。定义3.13:不涉及不同抽象层的项(或属性)的规则称为单层关联规则。

分类关联规则

关联规则的应用范围越来越广泛,根据不同的标准可将关联规则进行以下分类:

(1)基于规则中处理的数据的类型。关联规则可以分为布尔关联规则和量化关联规则。

定义3.11(布尔关联规则):描述离散(或类别型)属性之间关系的关联规则称为布尔关联规则。

例如:性别=“女”职业=“教师”,是一个布尔关联规则,因为从处理的数据类型来看,“性别”属性仅包含{男,女}两个类别,而“职业”属性包含“教师,医生,律师”等有限个类别。

定义3.12(量化关联规则):描述量化(或数值型)属性之间关系的关联规则称为量化关联规则。

例如:性别=“女”平均收入=2300,是一个量化型关联规则,涉及的“平均收入”属性是数值型。

量化关联规则中也可能包含类别型属性,如厂名、品牌等。

挖掘量化关联规则可以直接对原始数据进行处理,或先对数值型属性(如年龄、价格、收入等)进行预处理转换后再做处理,如将属性的量化值先划分为区间或进行动态分割。

量化关联规则常常和下面将要介绍的多维关联规则或多层关联规则结合起来。如年龄=“30,…, 39”∧工作时间=“1年,…, 5年”年收入=“40000,…, 49000”,是一个量化且多维关联规则(在此年龄、工作时间、年收入等量化属性已经过区域划分,做了相应的离散化处理,参见3.2.2节关于量化关联规则挖掘原理的内容)。

(2)基于规则中数据的抽象层次。关联规则可以分为单层关联规则和多层关联规则。

(www.xing528.com)

图3-1 体育商品概念层

在单层关联规则中,所有的项(或属性,如多维关联规则中项常常是表示属性,见定义3.1)不考虑现实数据的多层性;而在实际应用中,涉及在不同的抽象层发现的多层关联规则是一种更有用的关联规则,因为项(或属性)的概念间存在一种层次关系,比如例3.2中可以涉及产品的品牌和型号(图3-1),如Adidas篮球、Nike篮球都属于篮球类;篮球、足球又都属于球类;球类和球服又都属于体育用品。有了这样的层次关系后,可以帮助发现更多有意义的关联规则,例如“篮球足球”(篮球和足球是较高抽象层次上的概念)。由于商店或超市中有成千上万种物品,平均来讲,每种物品(如Nike篮球)的支持度都很低,因此有时难以发现有用的规则,但如果考虑到较高层次的物品(如篮球),则其支持度就较高,从而可能发现有用的规则。因此在实际应用中,可以针对不同的应用目的,选择不同的层次。

定义3.13(单层关联规则):不涉及不同抽象层的项(或属性)的规则称为单层关联规则。

例如:“Adidas篮球”“Nike篮球服”,是一个细节数据上(品牌层)的单层关联规则。

定义3.14(多层关联规则):涉及不同抽象层的项(或属性)的规则称为多层关联规则。

例如:“篮球“Nike篮球服”,是一个较高层次(球类用品层)和细节层次(品牌层)之间的多层关联规则。

(3)基于规则中涉及的数据的维数,关联规则可以分为单维关联规则和多维关联规则。

定义3.15(单维关联规则):单维关联规则处理同一个属性(或维)内的联系。

定义3.16(多维关联规则):多维关联规则处理多个属性(或维)之间的联系。

在单维关联规则中,只涉及数据的一个属性(或维),如用户购买的物品;而在多维的关联规则中,要处理的数据将涉及多个不同的属性(或维),如用户年龄和购买的物品。例如:购买=“篮球”购买=“篮球服”,这条规则只涉及用户购买的物品,此时,定义3.1中的项可以认为是购买的物品,因此在本章的一些单维关联规则中,仅仅给出交易的相关项(物品),而省略了属性(如“购买”);年龄=“20, …, 29”购买=“篮球”,这条规则涉及两个属性的信息,是两个维上的一条关联规则,此时,定义3.1中的项则指属性(或维)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈