登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

基于知识图谱的社交网络用户分析及可视化毕业论文

 2021-12-21 21:47:05  

论文总字数:25202字

摘 要

由于近几年移动互联网和物联网迅速发展和普及,社交网络逐渐发展成为了普通民众日常生活必不可少的一部分。庞大的社交网络因此产生了海量的数据。但使用传统的关系数据库存储用户数据并进行分析的方式效率比较低,且大多数的推荐算法都是基于用户标签的方法,存在过度推荐的问题。而知识图谱是近几年发展迅速的领域,它来源于语义网络,通过知识图谱可以揭示实体和概念之间的关系,并让计算机拥有理解人类文本的能力。使用图的方式来展现知识是知识图谱的最初目的。谷歌、微软、百度都推出了自家的知识图谱,并成功应用在搜索引擎、自然语言处理、语音视觉识别等领域。

因此,本文试图将知识图谱技术运用在社交网络的用户分析中。首先对用户发表的微博内容进行关键词的提取,从中获取有用的信息,过滤掉无实义的、对推荐算法不重要的词汇。此处我们的是Textrank、TF-IDF和LDA三种关键词提取算法,分析三者的的实现原理并计算准确率,选出最合适的一个算法。随后利用国内复旦大学实现的CN-Probase概念图谱来建立我们需要的知识图谱,并展示各个用户的兴趣画像。使用了基于权重的深度遍历(WDFS)和基于权重的深度遍历(WBFS)两种遍历方法,根据遍历结果进行用户推荐,计算准确率。

本文特色是将当前前沿的知识图谱技术运用到社交网络用户分析中,提出了一种结合了基于内容和基于用户的社交网络用户分析方法,并根据分析的结果进行推荐。

关键词:社交网络、知识图谱、推荐算法、关键词提取

Analysis of Social Network Users Based on Knowledge Graph

Abstract

With the rapid development and popularization of mobile Internet and Internet of things, social network has gradually become an indispensable part of ordinary people's life. Social networks are characterized by large number of users and high frequency of use, thus generating massive amounts of data. However, traditional relational database to store users’ data and conduct data analysis is inefficient, and most of the recommendation algorithms are based on user tags, which has the problem of excessive recommendation. Knowledge mapping is a rapidly developing field in recent years. Essentially it is a semantic network, revealing the relationship between entities and concepts. The use of graphs to represent knowledge is the original purpose of a knowledge graph. Google, Microsoft and baidu have all launched their own knowledge graphs, which have been successfully applied to search engines, natural language processing, speech and visual recognition and other fields.

Therefore, this paper attempts to apply knowledge mapping technology to user analysis of social networks. Firstly, extract the keywords from the microblog content published by users to obtain useful information and filter out the meaningless words that are not important to the recommendation algorithm. Here we use Textrank, tf-idf and LDA algorithm for keyword extraction to analyze the implementation principles of the three and calculate the accuracy, and select the most suitable algorithm. Then, the cn-probase concept map realized by fudan university in China is used to build the knowledge map we need. Two traversal methods, depth traversal, breadth traversal, depth traversal based on weight and depth traversal based on weight, are used to recommend users according to the traversal results and calculate the accuracy.

The feature of this paper is to apply the current cutting-edge knowledge mapping technology to the analysis of social network users, suggest a method combining content-based and user-based analysis of social network users, and make recommendations based on the results of the analysis.

Keyword: social network,knowledge graph, recommendation algorithm, keyword extraction

目录

摘要 I

Abstract Ⅱ

第一章 绪论 1

1.1 背景分析 1

1.2 国内外研究现状 2

1.2.1 协同过滤算法 2

1.2.2 基于内容的推荐算法 2

1.2.3 知识图谱技术 4

1.3 本文工作内容 5

第二章 相关技术基础 7

2.1 关键词提取 7

2.1.1 “结巴”分词 7

2.1.2 Textrank算法 7

2.1.3 TF-IDF算法 9

2.1.4 LDA主题模型关键词提取算法 10

2.2 CN-Probase概念图谱 10

2.3 Neo4j图数据库 12

第三章 关键词提取 13

3.1 数据预处理及归一化 13

3.2 Textrank 14

3.3 TF-IDF 17

3.4 LDA 18

3.5 三者方法的比较 19

第四章 建立知识图谱 22

4.1 获取用户属性 22

4.2 建立知识图谱 24

第五章 用户推荐 28

5.1 数据集准备和评价标准 28

5.2 两种遍历方法的实现及其比较 28

第六章 总结与展望 33

参考文献 34

致谢 36

第一章 绪论

背景分析

随着新时代互联网上的社交网站发展日益繁荣,我们从过去的PC时代来到如今的移动互联网时代,网络技术和终端设备的迅猛发展,促使手机和4G的普及,使得社交网络已经融入了普通人的生活,成为了人们必不可少的工具之一。截至2014年12月,日常生活中通用的主流社交网站(包括Facebook、Twitter、QQ、百度贴吧及新浪微博等) 月活跃用户之和已经达到了 40 亿人次。[1]

请支付后下载全文,论文总字数:25202字

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图