首页 理论教育 推荐系统中概貌属性提取方法

推荐系统中概貌属性提取方法

时间:2023-11-21 理论教育 版权反馈
【摘要】:文献[105]中列出了一些推荐系统概貌属性,本书的算法选取DegSim和RDMA两个概貌属性作为托攻击检测算法的检测特征。图4.2展示了DegSim和RDMA属性的提取和概貌之间的关系。图4.3是DegSim和RDMA在均值攻击下的属性值分布情况。RDMA计算每个项目中概貌的平均误差值,RDMA属性的计算如公式(4.1)所示。DegSim是基于用户概貌最近k个最近邻居相似度度量的一个概貌属性值。

推荐系统中概貌属性提取方法

文献[105]中列出了一些推荐系统概貌属性,本书的算法选取DegSim和RDMA两个概貌属性作为托攻击检测算法的检测特征。图4.2展示了DegSim和RDMA属性的提取和概貌之间的关系。图4.3是DegSim和RDMA在均值攻击下的属性值分布情况。

(1)RDMA(Rating Deviation from Mean Agreement)

计算每个项目中概貌的平均误差值,RDMA属性的计算如公式(4.1)所示。

其中,Nu是用户u项目评分的个数,ru,i是用户u对项目i的评分值是项目i上所用评分的平均值,NRi是评分矩阵中对项目i所有评分的个数。

(2)DegSim(Degree of Similarity)

除了基于评分差异的概貌属性,因为托攻击概貌是由机器产生的,但是真实用户概貌的评分比较分散,研究者们发现攻击概貌和其k个最近邻居具有较高的相似度,这个特性可使用DegSim概貌属性捕捉。

DegSim是基于用户概貌最近k个最近邻居相似度度量的一个概貌属性值。概貌的VDegSim的计算如公式(4.2)所示。(www.xing528.com)

其中,Wuv是用户概貌u和v的皮尔森相似度,k是用户最近邻的个数,k值可以由数据集来决定。在本书中,选取k=20,即选取每个用户的最近邻20个邻居的相似度平均数作为每个概貌的DegSim值。

图4.2 VDegSim和VRDMA概貌属性提取

从图4.3中可以看出,在均值攻击模型下,托攻击用户的DegSim属性值普遍比真实用户的DegSim属性值低;而托攻击用户的RDMA属性值普遍比真实用户的RDMA属性值高。根据这个特征,在整个评分矩阵中DegSim属性值偏低,并且RDMA属性值偏高的用户评分概貌是托攻击概貌的可能性大。在第一个阶段中,选取RDMA属性值偏高的用户评分概貌作为托攻击检测结果的候选集。

图4.3 DegSim和RDMA属性分布(按概貌ID)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈