耦合社交网络环境下基于扩散过程的推荐算法研究

作 者 : 邓小方

学位授予单位 : 江西财经大学

学位名称 : 博士

导师姓名 : 钟元生

学位年度 : 2017

关键词 : 耦合;网络环境下;扩散过程

摘 要 : 互联网的快速发展给我们的日常生活带来了很大的影响,大大改变了我们获取信息的方式。它为我们提供了丰富的在线内容,使得我们需要耗费大量的时间在海量信息中浏览并寻找所需要的信息,这通常被称为“信息过载”问题。为了克服“信息过载”问题,国内外学者发明了很多信息过滤技术,其中最具代表性的是搜索引擎和推荐系统。搜索引擎能够根据用户提供的关键字返回与之相关性最高的网页,虽然已被广泛应用,但它仍然存在两个明显的不足。首先,对于经验不够丰富的用户来说提供准确的搜索关键字是很困难的;其次,对于给定的关键字搜索引擎总是返回非个性化的搜索结果。推荐系统则利用用户的历史选择信息、评价信息等帮助用户寻找与之相关联、感兴趣和有用的信息。推荐系统无需用户输入关键字且返回个性化的推荐结果,克服了搜索引擎所存在的不足。目前,推荐算法已经在电子商务、计算广告、在线教育和在线医疗等领域得到了广泛应用并带来了巨大的商业价值。在大多数实际应用中用户的历史行为信息是非常稀疏的,由于缺乏足够的用户历史数据,推荐系统通常很难给出精准的推荐,这通常被称为数据稀疏性问题,它长期以来一直困扰着推荐系统。社会影响力在产品营销中发挥着极其重要的作用,然而传统的推荐系统却没有将它纳入到推荐框架中。随着在线社交网络的快速崛起,基于社交网络的推荐已经变成一种有重要意义且富有成效的推荐方式。现有的基于社交网络信息的个性化推荐算法各有优势与不足,但它们的共同特点是几乎都需要评分、标签或用户的社会属性等额外信息,而这些附加信息并不容易获取,而且其真实性也得不到保证。近年来,由于只关注用户的选择信息而不需要标签或评分等额外信息,基于复杂网络尤其是二部图的推荐算法受到越来越多的学者关注。该类算法借鉴物质扩散与热传导的思想,将推荐系统输入数据抽象为复杂网络模型,在算法复杂性上低于经典的协同过滤算法,并且具有较好的可扩展性。然而该类算法至今未能有效地融入社交网络信息,其推荐精度存在较大的提升空间。针对已有研究工作存在的问题和挑战,本文对利用扩散过程融合社交网络信息的推荐算法进行了深入的研究,主要包括融合社交网络信息的物质扩散推荐算法、考虑用户间信任传递的物质扩散推荐算法、既融合社交网络信息又在扩散过程中将物质扩散和热传导相结合的推荐算法等。本文的主要工作和贡献如下:(1)提出了融合社交网络信息的物质扩散推荐算法。该算法利用物质扩散过程将社交网络信息有机地融入到推荐过程中,通过一个调节参数控制社交网络信息的参与程度。实验结果表明,当用户选择的item很少时,社交网络信息在推荐过程中发挥了极其重要的作用。在数据特别稀疏的情况下,该算法较传统的物质扩散和混合算法在推荐准确度方面提高的幅度非常大,这一方面说明该算法特别适用于用户-item二部图相对稀疏而社交网络相对稠密的两层耦合网络,另一方面也显示了该算法在缓解数据稀疏性问题上的能力。对于数据稀疏性问题的极端情况冷启动问题,实验结果表明该算法较基于item流行度排序的算法在推荐准确性、多样性和新颖性等方面均有较大幅度的改进,该方法为缓解冷启动问题提供了新的思路。(2)提出了一种考虑用户间信任关系传递的推荐算法。该算法利用物质扩散过程将社交网络信息有机地融入到推荐过程之中,不仅利用目标用户直接好友的用户-item选择信息而且还借助了目标用户的二阶好友的用户-item选择信息。实验结果表明,在目标用户选择的item特别少时,该算法的推荐精度较传统的物质扩散算法得到了较大幅度的提升。而在目标用户选择的item特别多时,该算法能够在一定程度上改进传统物质扩散算法的推荐多样性。(3)提出了一个在推荐过程中利用物质扩散和热传导相结合的扩散过程有机地融入社交网络信息的推荐算法,该算法利用社交网络信息和用户-item历史选择信息、扩散过程采用物质扩散和热传导相结合的方式为用户提供个性化推荐。传统的物质扩散算法、热传导算法、混合算法以及本文提出的融合社交网络信息的物质扩散推荐算法都是该算法的特例。实验结果表明,由于资源传输方式的改变,该算法几乎在所有评价指标方面都优于本文提出的融合社交网络信息的物质扩散推荐算法。在推荐精度方面,该算法较物质扩散算法、热传导算法和前二者的混合算法均有一定程度的改进。

      • 温馨提示:
      • 在微信、微博等APP中下载时,会出现无法下载的情况
      • 这时请选择在浏览器中打开,然后再请下载浏览

发表回复

后才能评论