基于大数据的电影可视化分析毕业论文
2021-11-09 21:13:13
摘 要
本文对豆瓣电影的数据进行了抓取和可视化。通过不同的角度和方向,不同的电影、不同的国家、不同的导演、演员等之间的相互关系以视觉图表的形式展现出来。在生成的可视化界面中能够直观的认识和了解电影的数据显示结果,对不同情况进行对比使其在电影数据的内容参考具有重要的指导意义。
本文主要研究从豆瓣电影网站上抓取电影数据中的多个电影关键词之间的关系。并对一些著名电影进行具体分析,包括电影关键词、电影不同星级评分人数分析等。最后,对数据中的中国著名导演及其相关电影工作人员进行详细的了解。
研究结果表明:随着时间的推移,不同国家制作的电影数量逐渐增加,剧情类的电影是大多数国家以及导演比较偏爱的电影类型,观看电影的人员更偏向于剧情和科幻类的电影,比较有名的中国导演更喜欢和不同的演员进行合作。
本文的特色:对近些年的电影进行了爬取数据和分析数据,并从不同角度对电影进行了解和认识,从本文中能够认识电影的信息数据之间的关系。
关键词:电影大数据;数据爬取;数据分析;可视化
Abstract
This article captures and visualizes the data of Douban movies. Through different angles and directions, the interrelationships between different movies, different countries, different directors, actors, etc. are displayed in the form of visual charts. In the generated visual interface, you can intuitively understand and understand the movie data display results. Comparing different situations makes it important to guide the content of movie data.
This article mainly studies the relationship between multiple movie keywords captured from movie data on Douban movie website. And specific analysis of some famous movies, including movie keywords, analysis of the number of movie star ratings. Finally, a detailed understanding of the famous Chinese directors and related film crews in the data.
The results of the study show that: over time, the number of films produced in different countries has gradually increased. Drama films are the types of films preferred by most countries and directors. People watching movies are more inclined to plot and science fiction movies. Famous Chinese directors prefer to cooperate with different actors.
Features of this article: crawling and analyzing movie data in recent years, understanding and understanding movies from different angles, and information and data about movies can be found in this article.
Key Words:Movie big data; Data crawling; Data analysis; Visualization
目 录
摘 要 I
Abstract II
目 录 3
第1章 绪论 1
1.1 研究目的和意义 1
1.2 研究现状 1
1.3 本文主要工作 2
1.4 论文组织结构 3
第2章 数据可视化系统研究 4
2.1 需求研究 4
2.2 功能模块设计 5
2.3 关键技术介绍 6
2.3.1 数据采集技术 6
2.3.2 数据可视化技术 7
2.4 本章小结 8
第3章 数据获取与处理 9
3.1 问题描述 9
3.2 数据的采集 9
3.3 数据清洗 11
3.4 数据存储 12
3.5 本章小结 13
第4章 可视化模块分析 14
4.1 电影总体分析 14
4.1.1 不同国家电影大数据可视化分析 14
4.1.2 电影特征大数据可视化分析 15
4.2 电影个体分析 16
4.2.1 影评关键词可视化分析 16
4.2.2 电影制作人员关系可视化分析 17
4.3 电影人分析 18
4.4 本章小结 19
第5章 结论与展望 20
5.1 结论 20
5.2 展望 20
致 谢 21
参考文献 22
附 录 23
绪论
研究目的和意义
近年来,在资金、技术和应用的驱动下,全球电影产业的技术发展呈现出一体化、高端化、信息化、智能化和综合化的基本趋势。随着信息技术在互联网时代的发展,高科技电影的应用,尤其是以大数据分析与可视化、智能科学和机器学习为代表的新一代信息技术,已经进一步渗透到电影产业的各个方面,深刻影响着整个电影产业的发展模式。
在这个互联网将渗透到整个电影产业链中的时代,网络数据对电影的影响不断加大[1]。值得一提的是亚马逊(AMZN)和奈飞(Netflix)在数据分析方面取得的显著成就,这已经成为大数据指导电影创作的典型案例。两者都始于多年前的光盘销售和租赁,近年来都使用流媒体点播数据和可用的用户行为数据来指导电影和电视节目的创作。在电影大数据研究领域,中国电影科学技术研究院建立了电影大数据分析处理系统,在2016年广播影视科技展上,为总局和电影行业领导进行大数据分析和可视化系统展示,引起了业界的关注。
自从互联网进入中国电影业以来,对网络数据的研究一直没有中断过,但与国外相比,我国对电影数据的研究仍处于发展阶段。目前,对中国电影的大数据和可视化研究主要是在传统影视理论的框架下进行的。研究重点主要集中在海量数据的分析、平台上不同地区和受众群体的收视率评价、产业链上游的网络文学和海外戏剧的内容和创作素材,以及通过电影预测大数据系统对票房和电影预期的预测。