登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 通信工程 > 正文

基于循环神经网络的豆瓣短评情感分析毕业论文

 2022-01-28 22:48:37  

论文总字数:25939字

摘 要

近年来,经济发展带来人民生活水平的提高,也加速推进了国内电影产业的飞速发展,越来越多的人民群众选择通过电影进行娱乐。同时,由于用户逐渐倾向于在公众平台上发表观点,网络平台上的电影评论数量也出现爆发性增长。

庞大的影评数据看似琐碎,并且是不规则的文本信息,但其中却蕴藏着庞大的研究价值。针对电影评论,挖掘其中的潜在的情感信息,得到观众的情感倾向,有助于为用户观影进行决策,也有助于作为影院排片的参考,更有助于电影从业者对观众喜欢的题材进行分析,针对市场需求进行创作。

本文以豆瓣网的一系列电影短评作为语料库,通过网络爬虫对豆瓣短评进行爬取,基于TensorFlow框架搭建循环神经网络模型,运用深度学习方法LSTM及GRU模型来进行文本分类,判断评论的情感极性,最后通过可视化技术对情感分析的结果进行展示。

关键词:豆瓣评论 网络爬虫 情感分析 循环神经网络 TensorFlow

The Sentiment Analysis of Douban Short Reviews Based on Recurrent Neural Networks

ABSTRACT

In recent years, economic development has brought an improvement in people’s living standards,and has also accelerated the development of domestic film industry. More and more people now choose to entertain through movies. At the same time, users are inclined to express their opinions, attitudes and emotions on the public platform gradually, so the number of movie reviews on the Internet has also been exploded.

The huge movie reviews may seem trivial and irregular text information, but it contains a huge amount of research value. Focusing on film reviews, tapping potential emotional information of the audiences will help new audiences make decisions. It also helps to serve as a reference for movie theater screening and helps moviegoers analyze the subject audiences like, then they can create films for market demand.

In this article, a series of short reviews on Douban website are used as a corpus. The web crawler crawls Douban short comments. Based on the TensorFlow framework, a recurrent neural network model is constructed. The deep learning method LSTM and GRU models are used to classify the text and determine the emotional polarity of the comments. Finally, the results of the sentiment analysis are presented through visualization techniques.

Key Words: Douban reviews; web crawler; sentiment analysis; recurrent neural networks; TensorFlow

目 录

摘 要 I

ABSTRACT II

第一章 绪论 1

1.1研究背景 1

1.2 研究现状 2

1.2.1 基于情感词典的分析方法 2

1.2.2 基于机器学习的分析方法 2

1.3 本文主要工作 3

1.4 本文章节安排 4

第二章 相关理论技术 5

2.1 网络爬虫相关知识 5

2.1.1 网络爬虫与Python语言 5

2.1.2爬虫基本结构 5

2.2机器学习相关知识 6

2.2.1 机器学习 6

2.2.2 深度学习 6

2.2.3 监督学习与无监督学习 7

2.2.4人工神经网络 7

2.2.5循环神经网络 9

2.2.6 LSTM模型 10

2.2.7 GRU模型 12

2.3 本章小结 13

第三章 网络爬虫设计 14

3.1 目标数据分析 14

3.2 数据格式 14

3.3 正则表达式 15

3.4 模拟登陆 16

3.5 数据存储 17

3.6 本章小结 18

第四章 基于循环神经网络的影评情感分析 19

4.1 TensorFlow 19

4.2 文本预处理 19

4.2.1中文分词 19

4.2.2 去除停用词 20

4.1.3 词嵌入 20

4.2 网络框架搭建 21

4.2.1 创建批次 21

4.2.2 输入层 22

4.2.3 嵌入层 22

4.2.4 Dropout层 22

4.2.5 LSTM/GRU层 23

4.2.6 全连接层 23

4.2.7 输出层 24

4.3 模型训练 25

4.4 模型情感预测 26

4.5 本章小结 26

第五章 情感分析的可视化 27

5.1 可视化工具 27

5.1.1 TensorBoard 27

5.1.2 Excel图表 27

5.2 神经网络可视化 27

5.2.1 正确率和损失值 28

5.2.2 模型比较 29

5.3 情感分析可视化 30

5.4 本章小结 31

第六章 总结与展望 32

6.1 总结 32

6.2 展望 32

参考文献 34

致谢 36

第一章 绪论

1.1研究背景

自然语言处理[1](Natural Language Processing, NLP)属于计算机科学与语言学的交叉学科,主要目的是实现人类与计算机之间通过自然语言进行交互,即使计算机能够直接通过理解人类通过自然语言表达的信息,做出相应的反馈。可以说,自然语言处理是计算机人工智能领域的一个分支。

请支付后下载全文,论文总字数:25939字

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图