首页 理论教育 用户兴趣建模方法及实现步骤

用户兴趣建模方法及实现步骤

时间:2023-10-31 理论教育 版权反馈
【摘要】:用户兴趣模型有多种表示方法,常用的方法包括评分矩阵、兴趣粒度、神经网络、关键词列表、向量空间模型、本体论等方法,其中向量空间模型是目前使用较为广泛,效果较好的兴趣建模方法[24][25]。可以看出,向量空间模型的主要工作涉及两个方面,首先,确定用户主要喜爱不同项目,将用户兴趣表示成多个维度;其次,确定不同项目的权重,综合表示用户兴趣。本节对用户兴趣进行建模,同样遵循向量空间模型的两个步骤。

用户兴趣建模方法及实现步骤

用户兴趣模型有多种表示方法,常用的方法包括评分矩阵、兴趣粒度神经网络、关键词列表、向量空间模型、本体论等方法,其中向量空间模型(Vector Space Model)是目前使用较为广泛,效果较好的兴趣建模方法[24][25]

向量空间模型将兴趣模型用n维特征向量{(t1,w1),(t2,w2),…,(tn,wn)}来表达,ti表示表示用户喜爱的各个项目,wi表示用户的特征项ti对项目的喜爱程度,wi的取值通常可以用介于0到1之间的数值进行标示,1代表完全感兴趣,0代表完全不感兴趣。可以看出,向量空间模型的主要工作涉及两个方面,首先,确定用户主要喜爱不同项目,将用户兴趣表示成多个维度;其次,确定不同项目的权重,综合表示用户兴趣。第一个方面的工作即特征降维,主要方法包括特征选择和特征抽取,特征选择方面常用的方法如文档频率、互信息、信息增益、卡方统计量、期望交叉熵、优势率等[26],而特征抽取工作中,潜在语义分析(LSA)、主成分分析(PCA)、潜在狄氏配置(LDA)则是近几年来的重要抽取方法和研究对象[27]。第二个方面的工作内容为特征加权,通常的做法是直接使用TF-IDF算法计算特征权重,同时也有相关研究对TF-IDF赋权法进行改进[28]。(www.xing528.com)

本节对用户兴趣进行建模,同样遵循向量空间模型的两个步骤。首先在特征选择方面,将资源的主题作为用户的兴趣,将用户兴趣表示为一系列主题;其次,在特征加权方面,依据不同主题资源的热度设计赋权策略,得到用户兴趣模型,并设置对照组进行比较。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈