基于复杂网络的影视娱乐大数据分析系统毕业论文
2021-12-22 22:15:17
论文总字数:31205字
摘 要
影视行业在近些年的飞速发展,很大程度也带动了对大数据服务的市场需求。对于影视行业而言,其生产经营等各个环节都会产生各种数据,如今互联网的快速发展、智能手机的普及、网上各大购票平台使用人数的增加、在线流媒体平台的火热等等,给影视数据的产生营造了一个优良的环境。随之而来的海量影视数据,对于影视制作方而言,是其了解观众喜好、市场环境等的宝贵信息。对于影视大数据之间错综复杂的关系,应用复杂网络理论进行数据分析,可以让我们以网络的角度、观点和方法来分析影视数据之间的联系,挖掘深藏其中的价值,让影视大数据更好的为影视创作服务。
本文针对影视大数据,以复杂网络理论为依据,设计实现了影视娱乐大数据分析系统用于对影视数据进行分析以及结果的可视化。本系统选择用Python来编写,是基于Django框架的Web系统,采用MTV设计模式来开发,后端选择Neo4j和MySQL数据库来存储管理数据。通过对网上影视数据的爬取,对数据进行处理抽象出构建关系网络所需的实体以及关系,结合Neo4j图数据库构建影视复杂网络。浏览器端选用ECharts作为关键技术来实现各结果的可视化呈现及用户交互。系统实现了人物关系网络查询、影片类型分布统计、网络社区发现等功能,帮助用户挖掘蕴含于影视大数据中的价值。在未来,基于Neo4j高效处理非结构化数据的特性,本系统可以进一步拓展,构建影视知识图谱可视化平台,为用户提供更好的影视数据分析服务。
关键词:复杂网络;社区发现;影视大数据;数据可视化
An entertainment-oriented big data analysis system based on complex networks
Abstract
In recent years, the rapid development of the film and television industry has also greatly driven the market demand for big data services. For the film and television industry, all aspects of its production and operation will generate a variety of data. Nowadays, the rapid development of the Internet, the increase in the number of online ticket purchasing platforms, the popularity of online streaming platforms, etc., creates an excellent environment for film and television data generation. The huge amount of film and television data that comes with it is valuable information for film and television producers to understand audience preferences and market environment. For the intricate relationship between big data, the application of complex networks theory for data analysis can allow us to analyze the data from the perspective of the network, viewpoints and methods, tap the value hidden in it, and make these data serve the film and television creation better.
This article aims at film and television big data, based on the complex networks theory, and designs and implements a film and television entertainment big data analysis system for analyzing film and television data and visualizing the results. This system is a Web system based on Django framework developed by using Python. It is developed using MTV design mode. The back end chooses Neo4j and MySQL database to store management data. By crawling online movie and television data, the data is processed to abstract the entities and relationships needed to build a relational network, and the Neo4j graph database is used to build a complex movie and television network. The browser end uses ECharts as the key technology to realize the visual presentation and user interaction of each result. The system implements functions such as character relationship network query, film type distribution statistics, and online community discovery, etc., to help users mine the value contained in film and television big data. In the future, based on the characteristics of Neo4j's efficient processing of unstructured data, this system can be further expanded to build a visual platform for film and television knowledge graphs to provide users with better video data analysis services.
Keywords: complex networks; community detection; big data of film and television; data visualization;
目 录
摘 要 I
Abstract II
第一章 绪 论 1
1.1背景及意义 1
1.2研究现状 1
1.3主要研究内容 2
1.4本章小结 2
第二章 相关理论和技术 3
2.1复杂网络理论 3
2.1.1复杂网络基础 3
2.1.2复杂网络的统计特征 4
2.1.3社区发现算法 4
2.2技术背景 8
2.2.1 Python 8
2.2.2 Django简介 8
2.2.3 Neo4j图数据库和MySQL数据库 9
2.2.4 ECharts简介 9
2.3本章小结 10
第三章 需求分析与系统设计 11
3.1可行性分析 11
3.2需求分析 11
3.2.1非功能需求 11
3.2.2功能需求 12
3.3数据库设计 13
3.3.1数据库结构设计 13
3.3.2数据库的逻辑结构设计 14
3.4系统总体设计 16
3.4.1 系统功能 16
3.4.2 系统架构 17
第四章 系统功能实现 19
4.1 Django项目配置 19
4.1.1 配置MySQL数据库 19
4.1.2 配置Neo4j数据库 20
4.2前端界面 21
4.3主要功能 21
4.3.1影片信息总览 21
4.3.2影片相关信息查询 25
4.3.3演员信息总览 27
4.3.4演员相关信息查询 30
4.3.5关系网络查询 32
4.3.6关系路径查询 33
4.3.7基于度的演员票房信息 34
4.3.8社区骨干成员网络 35
第五章 系统测试 39
5.1测试环境和测试方法 39
5.2测试内容 39
第六章 总结与展望 41
6.1总结 41
6.2展望 41
参考文献 42
致 谢 44
第一章 绪 论
1.1背景及意义
当下物联网、移动终端以及互联网每天都在产生信息,如何从海量的数据中准确而迅速地获取到想要的信息便是大数据技术的核心。正是因为大数据中潜藏这难以估量的价值,如今这项技术收到越来越多的关注。大数据的核心就是为用户挖掘出蕴含在数据中的价值,基于这一点,对于各个领域中的大数据的应用研究成为该产业顺利发展的关键。如今我们已进入大数据时代,大数据技术早已应用在各行各业中。其不仅仅影响着电商、医疗、金融等行业,在文化方面的各个产业领域中也起到重要作用[1]。
请支付后下载全文,论文总字数:31205字