基于网络社交平台的情感数据抓取与分析开题报告
2022-01-09 22:31:14
全文总字数:1691字
1. 研究目的与意义及国内外研究现状
近些年来,各种网络社交平台成为人们进行交流的重要途径,在这些平台中,用户可以自己创作内容,表达观点和情绪。基于社交网络的情感分析也成为了当下的一个热点。
情感分析作为一项研究领域与网络数据爬取、计算机语言学、自然语言处理和文本挖掘息息相关,常见的“意见挖掘”、“主观性分析”和“评价性提取”便是“情感分析”。情感分析是对文本中的意见、感受和主观性的自动提取,它的突然流行给个人和公司带来了机遇和威胁,接收并学会利用它的主体将会从中大大受益。
情感分析要回答“人们对某一问题感受如何”的问题,因此需要庞大的意见库,我们需要借助爬虫来获取所需数据。网络爬虫是一个自动提取网页的程序,针对不同的业务需求会有不同的数据爬取策略。
2. 研究的基本内容
本选题预期实现从情感数据的提取、处理到分析的整个流程,主要内容包括:
(1)熟悉网络爬虫涉及的基础知识并运用;
具体为:网络协议,常见反爬虫机制,网络爬虫策略及优化等。
3. 实施方案、进度安排及预期效果
本选题的实施方案和进度安排如下:
(1)2018年1月
针对python相关语法,网络爬虫的基础知识,分布式爬虫框架scrapy和情感分析策略进行系统研究和学习,并实现初步数据爬取。
4. 参考文献
[1]christensen w,suess r.hobbyist computerizedbulletin board.byte magazine,1978
[2]chen h,zimbra d.ai and opinionmining.intelligent systems,ieee,2010
[3]陈晓东,基于情感词典的中文微博情感倾向分析研究. 华中科技大学,2012