首页 理论教育 用户画像构建流程-信息推荐系统

用户画像构建流程-信息推荐系统

时间:2023-10-31 理论教育 版权反馈
【摘要】:用户画像涉及的内容维度在不同领域中亦不同,而在构建用户画像的过程中多采用统计学习、贝叶斯网络、神经网络、主题模型、聚类分析等方法。我们将用户画像模型的构建过程总结概括为四个主要步骤,即数据收集、数据预处理、用户特征属性提取及用户画像构建,构建流程如图8-2所示。图8-2用户画像构建流程图数据预处理是对收集到的数据进行清洗与整理,最终获得模型所需要的数据格式。

用户画像构建流程-信息推荐系统

用户画像真正的价值所在其实就是对真实用户的兴趣进行估计和预测,在推荐系统中用户画像的实现基本上分两个阶段完成,第一阶段包括用户画像的表示,其可以表示为具有指定权重的术语向量,或与一般本体的概念有关的语义加权或根据概念矩阵;第二阶段涉及个性化过程中的用户数据集成,建立用户个人用户画像时要考虑不同的维度,以此进行个性化推荐[13]。一方面,由于存储限制和关于用户的有限信息,用户画像的表示实质上是抽象的;另一方面,在内存和复杂性方面应使用紧凑的表示形式来确保用户画像的精准性和有效性。用户画像涉及的内容维度在不同领域中亦不同,而在构建用户画像的过程中多采用统计学习、贝叶斯网络、神经网络、主题模型、聚类分析等方法。例如,Amoretti等将用户画像的构建分为三个部分:①行为建模,对用户过去行为的分析可以预测未来用户的行为,因此行为建模的重点是与用户行为相关的模式,为此需要存储用户系统交互数据。②兴趣建模,用于计算用户对新产品,场所等的兴趣度的函数的定义。③意图建模,试图查找用户的最终目标或原因,行为和兴趣建模均可以成为意图建模的基础[14]

我们将用户画像模型的构建过程总结概括为四个主要步骤,即数据收集、数据预处理、用户特征属性提取及用户画像构建,构建流程如图8-2所示。

数据收集部分主要是根据用户画像所对应的研究群体,来选择数据获取来源及数据信息内容,同时还要考虑到获取数据所使用的方法。收集的用户数据包括能够体现用户社会属性、生活习惯以及消费行为等各方面的用户信息数据。用户画像的数据来源包括静态数据和动态数据两个部分。静态数据是用户相对稳定的数据,如用户年龄、地域等基础信息。动态数据是随着用户行为不断变化的信息,不同的应用领域动态数据也有所差别。

图8-2 用户画像构建流程图(www.xing528.com)

数据预处理是对收集到的数据进行清洗与整理,最终获得模型所需要的数据格式。数据预处理的方法有很多,对不同的数据形式有不同的处理方法。例如,对文本数据进行预处理,需要对数据集进行分词处理、去停用词和特殊词汇等;对图片数据源进行处理,则需要对图片进行向量化处理以及对图片进行特征提取等操作。

特征属性提取即是在收集用户数据的基础上,对其进行整理和分类,并通过一定的数据挖掘方法从中抽取用户特征,进一步提炼得到用户标签的过程。现有的用户画像研究主要通过两类方法来完成特征抽取[15],包括:①人工抽取:在相关理论的支持下,结合研究者的知识和经验,“描绘或者抽象用户属性差异”,从而抽取用户特征。该方法具有一定的主观性,仅适用于数据表达清晰、数据量小的研究场景。②技术抽取:通过机器学习算法抽取用户特征,如决策树、逻辑回归、支持向量机、贝叶斯网络、K均值算法、主题模型等算法,这些方法适用于大数据环境下海量用户数据的研究场景。

用户画像构建过程综合用户的各项特征属性,汇集用户的各项信息,利用构建好的用户标签抽象出用户数字信息的全貌,展现用户的特征偏好,其构建流程如图8-2所示。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈