首页 理论教育 内容过滤推荐系统模型-信息推荐系统

内容过滤推荐系统模型-信息推荐系统

时间:2023-10-31 理论教育 版权反馈
【摘要】:基于内容过滤的信息推荐系统需要适当的技术对资源项目和用户兴趣模型进行描述和构建,同时应运行相应的策略对资源项目和用户兴趣进行相关性匹配,从而使得推荐的资源项目最大程度上符合用户的当前兴趣和偏好。图3-2基于内容过滤信息推荐的系统模型资源项目分析模块随着Internet的发展,Internet已成为巨大的“信息资源数据库”。显式反馈是通过目标用户对推荐资源作出相应的评价来获取反馈信息。

内容过滤推荐系统模型-信息推荐系统

基于内容过滤的信息推荐系统需要适当的技术对资源项目和用户兴趣模型进行描述和构建,同时应运行相应的策略对资源项目和用户兴趣进行相关性匹配,从而使得推荐的资源项目最大程度上符合用户的当前兴趣和偏好。基于此,本节对基于内容过滤的信息推荐模型进行了总体结构设计[16],如图3-2所示。从图中可以看出,信息推荐执行过程分为三个步骤:资源项目内容分析、用户兴趣学习以及信息资源过滤。

图3-2 基于内容过滤信息推荐的系统模型

(1)资源项目分析模块

随着Internet的发展,Internet已成为巨大的“信息资源数据库”。但是,Internet上文本资源多是非结构化的,无法直接有效地存储和利用。因此,资源项目分析模块利用文本特征抽取技术,将这些文本资源(例如Web网页、新闻、商品信息等)进行特征抽取,转换成结构化的资源格式。例如,可以将Web网页进行特征抽取,将其表示基于特征词的文档向量。通过特征抽取和结构化的数据描述,系统将采集的文本资源存储在数据库中,并作为用户模型学习和资源过滤模块输入。

(2)用户兴趣学习模块

用户兴趣学习模块首先采集用户对资源的评价和反馈信息,从中获取和分析用户兴趣偏好,并对其进行归纳,在此基础上构建用户兴趣模型。通常,用户兴趣偏好的归纳可以通过机器学习方法实现,即通过用户过去对推荐资源的评分或反馈结果(如喜欢该资源或不喜欢)推导出用户的兴趣模型。例如,在Web网页推荐领域,用户兴趣学习模块利用相应的机器学习算法,将训练集中的正反馈文档和负反馈文档同时输入到表示用户模型的向量空间中,构建出用户的初始模型,并能实现相关反馈机制,定期地对用户兴趣模型进行更新。其中,训练集的样本文档由用户提供,即通过用户对这些Web页面的正面评价(如喜欢该网页)或负面评价(如不喜欢该网页)来提供正反馈文档和负反馈文档。(www.xing528.com)

(3)资源过滤模块

资源过滤模块基于用户兴趣模型,对目标资源与用户兴趣偏好进行相似度匹配,将相似度排名Top-N或大于阈值的信息资源推荐给用户。通过资源项目分析和用户模型构建,可以将资源项目和目标用户分别表示为资源文档向量和用户兴趣向量,通过余弦向量度量法计算两者的匹配程度,从而实现资源过滤功能。

基于内容过滤的信息推荐系统模型有几点应注意:

①资源项目的内容分析是整个信息推荐过程的第一步,其所采用的技术来自于信息检索领域的文本特征抽取技术。通过对资源进行预处理和特征词抽取,资源项目分析模块可以将采集的非结构化文档资源转换为结构化的文档资源,并将其保存在资源项目数据库中。

②系统将用户兴趣表示成n维空间中的一个向量,向量中的每一维元素由一个特征词及其权重组成,权重值表示用户对该特征词的感兴趣程度。在构建用户兴趣模型的初始阶段,系统通过用户训练样本数据集,可以计算出用户兴趣的初始向量,作为初始的用户兴趣模型。

③同时,用户的信息需求是一个长期的过程,其兴趣随着时间的推移而不断发生变化。用户兴趣模型能够根据目标用户对推荐资源所出的反馈信息及时地调整用户兴趣,从而使得系统对用户兴趣具有自适应动态跟踪能力。一般来说,用户反馈信息分为两类:正反馈信息(即推荐的文档资源与用户兴趣相关)和负反馈信息(即推荐的文档资源与用户兴趣无关)。用户反馈信息有两种获取方式:显式反馈(Explicit Feedback)和隐式反馈(Implict Feedback)。显式反馈是通过目标用户对推荐资源作出相应的评价来获取反馈信息。显式反馈通过用户给推荐资源给出评分或反馈意见获得,其优点是易与实施,用户表达对资源的兴趣和偏好非常明确。但是,显式反馈也存在很大的弊端,即用户必须主动参与资源评分,给其带来不便,用户很少耐心地浏览所有的推荐结果,并且对浏览的资源项目也不一定给出相关评分。因此,系统可以采取隐式反馈方法,通过分析目标用户的行为(如点击资源次数、浏览时间等),隐式地获取用户反馈信息来弥补显式反馈信息的不足。系统通过用户反馈信息,动态地调整用户兴趣向量,即对目标用户的兴趣模型进行更新,以此来学习和适应用户兴趣的变化。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈