登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

基于朴素贝叶斯的电影评论情感分析毕业论文

 2022-01-16 18:51:03  

论文总字数:19166字

摘 要

互联网的迅猛发展,使得人们的生活越来越离不开互联网,网络上愈来愈庞大的数据该如何进行有效地处理正成为现今较为热门的研究。对互联网中的数据进行有效地分析,不仅能给人们的生活带来巨大的便利,还能带来巨大的商业价值。而互联网中的主要信息便是文本数据,如何对文本数据的情感进行准确的分析在其中占据着重要地位。

本文介绍了朴素贝叶斯算法的基本原理。分析了高斯朴素贝叶斯,伯努利朴素贝叶斯与多项式朴素贝叶斯三种的应用及区别。说明了多项式朴素贝叶斯的先验概率与拉普拉斯平滑。

本文详细的说明了基于朴素贝叶斯算法的电影评论情感分析实现的过程。实现对电影评论的情感进行正负面的分析。针对中文文本在互联网中使用的不规范,对机器学习的准确度产生影响,提出了多种对数据预处理的方法。使得情感分析判断的准确度得到提高。对于数据处理的方法与算法实现给出了详细的分析与代码实现。

关键词:朴素贝叶斯,机器学习,情感分析

Abstract

The rapid development of the Internet makes people's life more and more inseparable from the Internet. How to deal with the increasingly large data on the network is becoming a hot research nowadays. The effective analysis of the data in the Internet can not only bring great convenience to people's life, but also bring great commercial value. The main information in the Internet is text data, among which how to accurately analyze the emotion of text data occupies an important position.

This paper introduces the basic principle of naive bayes algorithm. The applications and differences of gaussian naive bayes, Bernoulli naive bayes and polynomial naive bayes are analyzed. The prior probability of naive bayes and Laplacian smoothing of polynomial are explained.

This paper describes in detail the process of emotional analysis of film criticism based on naive bayesian algorithm. To realize the positive and negative analysis of film reviews' emotions. In view of the non-standard use of Chinese text in the Internet, which affects the accuracy of machine learning, several methods of data preprocessing are proposed. The accuracy of emotion analysis judgment is improved. Detailed analysis and code implementation of data processing method and algorithm are given.

Keywords:Naive Bayes,Machine Learning,Sentiment analysis

目 录

摘 要 I

Abstract II

第一章 关于影评情感分析的概论 1

1.1 课题背景及意义 1

1.2 文本情感分析发展现状 2

1.3 课题主要研究内容 3

1.4 论文结构 3

第二章 开发工具及相关技术 5

2.1 Python语言介绍 5

2.1.1 Python 5

2.2 Python各类库介绍 6

2.2.1 Sklearn 6

2.2.2 Numpy 6

2.2.3 Tkinter 7

2.2.4 Jieba分词 8

第三章 基于朴素贝叶斯算法的影评情感分析实现 10

3.1 朴素贝叶斯算法的概论 10

3.2 朴素贝叶斯算法三种模型 11

3.2.1 伯努利模型 11

3.2.2 多项式模型 12

3.2.3 高斯模型 13

第四章 系统的设计及实现 14

4.1 系统的设计 14

4.2 数据的导入与预处理 15

4.2.1 数据库的介绍 15

4.2.2 获得停用词 18

4.2.3 导入数据,进行处理 19

4.3 数据的训练 21

4.3 模型的保存与加载 22

4.4制作云图 24

4.5数据库的展示 25

4.6界面的实现与程序演示 26

第五章 总结与展望 29

5.1 本文主要工作 29

5.2 进一步的展望 30

参考文献 31

致谢 33

关于影评情感分析的概论

1.1 课题背景及意义

互联网在我们的生活中已经是不可或缺的一部分了,人们已经越来越依赖于使用互联网来进行娱乐、社交、工作。人们运用微博、头条、抖音等软件来交流社会热点,这些软件占据了人们生活中的大部分时间。根据第43次《中国互联网发展现状》显示,截至2019年2月28日,中国的网民规模达到了8.29亿人次,互联网普及率达到了59.6%,而其中手机用户就有98.6%,人均的周上网时间有27.6小时。互联网已经成为了我们生活中不可或缺的一部分,网民不再是像从前简单的从互联网中获取信息,而是成为了互联网中的一部分,向互联网中制造信息,传播信息。而通过文本来传播信息依然占据着主要的地位,网络中人们创造的文本信息相比于书面将会更加随意和简洁。并具有很大的创造性,人们不断使用新潮的网络词汇,表述方法在互联网中不受任何的限制。

情感分析已经越来越多的被应用到大家的日常使用当中。机器学习被广泛应用于各个领域。例如电子邮件过滤和计算机视觉处理等。机器学习与计算统计密切相关,数学的优化研究为机器学习提供了方法。机器学习最常用的便是用于预测分析。无论在研发还是日常生活中,机器学习都具备着极其重要的应用价值。

情感分析能高效的解决各类问题,能够帮助大家在一定规模上的转化出用户的想法。无论在社交,医疗,金融,甚至客户市场上都正在被大量的应用。它能够分析出大众的舆论走向,和大众的心理述求。在一些社交软件上对用户的情感

请支付后下载全文,论文总字数:19166字

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图