基于用户影响力加权的协同过滤算法
作 者 : 张文聪
学位授予单位 : 南京邮电大学
学位名称 : 硕士
导师姓名 : 周国强
学位年度 : 2015
关键词 : 协同过滤;复杂网络;影响力;近邻模型;遗忘曲线函数
摘 要 : 如今互联网资源随着伴随网络的壮大飞速发展,这使得人们获取信息及资源变得方便。但是由于媒体资源的增长的同时,项目资源的增长已大大的超出了使用者数量增长的幅度,因此使用者在面对海量资源时准确查找自己想要的信息变得困难,这就是信息过载问题。作为解决这个问题的主要方法之一,推荐系统技术应运而生,这种技术能够帮助使用者更快更准确的锁定自己所感兴趣的资源信息。推荐系统技术研究使用者的兴趣类别和行为特征,进而为使用者推荐资源,且该资源是符合用户兴趣与习惯的。作为二十一世纪的各种推荐系统中推广最成功、受众最多的推荐技术,协同过滤技术得到了业界专业人士的高度重视。顾名思义,协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使自己的推荐列表能够不断扩充自己感兴趣的物品,从而越来越满足自己的需求。一般说来传统协同过滤算法之中有几大技术难题,其中最主要的几个问题包括数据稀疏问题、冷启动问题以及系统可扩展问题等。本文主要对推荐系统的研究现状与应用进行了分析,并对其中的几种主要方法做出分类和总结。本文深入研究了各种协同过滤算法,在基于图模型的协同过滤推荐算法的基础上受到复杂网络启发,提出了一种基于用户影响力加权的协同过滤推荐算法,该算法利用用户的购买、浏览、点击等隐式数据构造用户—项目—用户网络,系统刻画用户-项目网络中的关联性结构关系的同时引入了基于遗忘时间曲线函数加权的时间上下文,并给出用户影响力度量的方法,最后结合用户评分等显式数据计算得到的相似性给出最终的加权推荐。相较于基于热传导理论的协同过滤、基于物质扩散理论的协同过滤推荐算法以及融合奇异性和物质扩散的协同过滤算法等本文提出的方法不单单利用显式信息或者隐式信息,而是结合二者充分利用用户信息,该方法能够缓解评分项目的稀疏性,同时较好的提高了算法在准确性和多样性上的表现,并且由于复杂网络方法的特点,计算方法直观容易理解,在大量用户与项目加入时计算较为方便,因此具有了不错的可扩展性。最后,详细介绍了本文从数据建模到最终推荐所有环节的伪代码,并在真实的实验数据集上使用java语言对本文的算法进行编码实现,在本文选取的多个实验结果评价指标上与其他算法进行比较,通过实验得出的结果与其他算法比较较优,证明了本文算法的可行性与准确性。

      • 温馨提示:
      • 在微信、微博等APP中下载时,会出现无法下载的情况
      • 这时请选择在浏览器中打开,然后再请下载浏览

发表回复

后才能评论