基于异构社交网络的多账号关联技术研究毕业论文
2021-03-22 22:24:48
摘 要
为了适应生活中的各种场景,越来越多的人选择同时加入不同类型的社交网络,而这些不同的社交网络通常包含着人们在特定场景中的信息。在这种情况下,通过识别多个社交网络中的同一个用户能够帮助我们从多个维度全面的了解用户。目前针对这个问题的解决方案主要集中在单方面的使用用户属性或关系匹配方法。也有一些方法综合考虑了两方面的信息,但是这些方法往往只是简单地通过参数将用户属性与关系相似性相关联,而用户在属性和关系两个维度上的相似性差别可能很大,直接将两者结果相关联可能会适得其反。与以往的大部分工作不同,本文采用了协同训练的方法来解决此类问题。社交网络的数据通常可以用两种不同的视图来展现,一种是属性视图,另一种是关系视图。本文首先独立地对两种视图中的数据进行了训练,然后将两种视图中的训练结果作为标签数据加入到了迭代训练过程中。最后,本文在两个真实的社交网络数据集上进行了实验,实验结果表明,本文提出的方法不仅提高了匹配结果的准确性,而且加快了匹配速度。
关键词:社交网络;账号关联;协同训练
Abstract
In order to fit the diverse scenes in life, more and more people choose to join different types of social networks simultaneously. These different networks often contain the information that people leave in a particular scene. Under the circumstances, identifying the same person across different social networks is a crucial way to help us understand the user from multiple aspects. The current solution to this problem is focused on using only profile matching or relational matching method. Some other methods take the two aspects of information into consideration, but they associate the profile similarity with relation similarity simply by a parameter. The matching results on two dimensions may have large difference, directly link them may reduce the overall similarity. Unlike the most of the previous work, we propose to utilize collaborative training strategy to tackle this problem. In this paper, we take the social network data into two different views, the one is profile view and the other is relation view. We first train the model on a separate view, and then associate the results on two views for iterative training. Finally, we run extensive experiments on two real-world social network datasets, and the experimental results show that our proposed method not only enhances the accuracy of the matching result, but also greatly speeds up the matching process.
Key Words:social network;account association;collaborative training;
目录
第1章 绪论 1
1.1研究背景及意义 1
1.2国内外研究现状 1
1.3面临挑战及解决方案 3
1.4本文的主要贡献及组织结构 5
1.4.1 本文主要贡献 5
1.4.2 本文组织结构 6
第2章 问题描述与定义 7
2.1问题描述 7
2.2关键词定义 7
2.3输入输出定义 7
2.4本章小结 8
第3章 模型概述 9
3.1初始化种子匹配用户 9
3.2属性匹配 9
3.3关系匹配 11
3.4协同训练 12
3.5本章小结 13
第4章 实验结果 14
4.1实验准备 14
4.2对比方法 14
4.3评价方案 15
4.4实验结果分析 15
4.5本章小结 18
第5章 总结与展望 19
5.1总结 19
5.2未来展望 19
参考文献 20
致谢 22
第1章 绪论
1.1研究背景及意义
目前在线社交网络用户数已经呈现爆炸式增长。 例如,Facebook每天活跃用户超过10亿,Twitter每月的活跃用户超过3.4亿[1,2]。在这些社交网络中,人们可以通过交朋友或加入具有相似内容的群体与他人建立社交联系。美国的一项调查显示,三分之二的美国成年人使用社交媒体平台,如Facebook,Twitter,MySpace或LinkedIn,与当前的朋友、家人和商业伙伴保持联系。事实上,许多用户同时参与了多个社交网络,如公共网络、私人网络、商业网络以及家庭网络等。每个人都在通过社交网络联系朋友,以满足自己不同层次的社交需求。例如,人们可能会使用Facebook与好友保持联系,使用Twitter来与明星互动,使用LinkedIn与商业伙伴进行业务交流。
由于单个的社交网络都是真实生活中社交网络的子集,对任何单个网络的分析可能都是部分的、不充分的,因为用户的部分行为和关系信息可能出现在其他线上网络中。例如,Facebook 中的朋友列表是对用户熟人信息的良好表示,但可能对用户工作联系人的代表性差,而LinkedIn是工作联系人的良好代表,但并不能很好的代表用户的私密好友。在这种情况下,识别多个网络中的同一用户,并将他们相互关联,能够帮助社交网络平台获取更多有价值的信息。例如,在LinkedIn网络中,新用户的社交关系和活动可能非常稀疏。在只使用一个网络的前提下,用户的朋友和位置推荐将变得非常困难。然而,如果平台同时也知道用户的Twitter帐号,用户在Twitter中的社交关系和网络中的位置数据则可以用来改善LinkedIn网络中的推荐性能。
将用户在多个社交网络中的账号进行关联,能够帮助社交网络平台获得更加丰富的人物画像,更深入地了解不同网络的用户特征,也能为许多应用提供理论性地指导。在电子商务领域,如果平台获取到用户的社交行为信息,则可以根据用户的兴趣偏好,为用户推荐其更感兴趣的商品,增强用户的购买欲望。在社交网络领域,用户在一个新的社交网络中注册时,所提供的信息往往十分稀少,此时要对用户进行好友推荐是十分困难的,如果平台能够关联用户在其他社交网络的账号,则可以根据用户在其他网络中的好友链接关系给用户提供更加精确的好友推荐服务。总的来说,关联多个社交网络的同一个用户有助于平台服务提供商获得更多的用户和通信流量,对实际应用平台具有重大的意义。