基于SVM的中文微博情感分析研究开题报告

2022-01-25 23:21:31

全文总字数：4039字

1. 研究目的与意义及国内外研究现状

我们可以从很多渠道获得网络信息，其中，主要的渠道是微博，各大论坛，新闻，评论等等。如果不对复杂的海量信息进行梳理，即使人们可以在网络上下载到资料，也很难获取到有价值的信息。没有经过处理的数据，只是一堆毫无意义的符号。只有在经过细化和分析之后才能得到其中有用的信息。人们才可以在通过阅读文档时形成自己的看法。收集、阅读和评论的工作在遇到海量的网络信息时会变得极其繁重复杂。在这个时候，对文本情感分析的研究就应运而生，它为人们提供了一套自动总结的系统，更好地有助于人们完成任务。

对文本的情感分析研究，具有实用的价值。在商业上，合理地运用文本情感分析研究，可以帮助企业更好、更便捷地去分析市场，处理客户的反馈等等。企业可以在微博营销和处理客户关系以及宣传时提高自身效益。生产厂家可以在用户对产品体验后，做出的评论中快速收集有用的信息，反馈到产品的制作过程中，从而提高市场竞争力。同时，政府部门可以搭建舆论分析的系统，从而领导们能够在最短的时间内，了解到群众对政府政策的反响。相关部门可以在突发的意外事件发生之后，及时有效地对群众的心里进行监测控制。此外，对某些特定人群做情感分析研究，也能够更有针对性地疏导他们的心理。

在海量的微博信息面前，凭借人工的力量去了解掌握用户的情感倾向，是一件极其繁重困难的事。研究怎样在微博中了解用户的情感倾向，在未来会是十分有意义的行为。基于这样的研究目的和意义，本文针对微博文本数据，建立基于svm的文本极性分类器，采用机器学习的方法，展开对微博情感分析的研究。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

2. 研究的基本内容

首先，对从网络上搜集的微博语句进行预处理，去除空格等符号，用jieba中文分词工具对收集的微博观点句进行分词处理，再通过stopwords 、哈工大停用词表和四川大学机器智能实验室停用词库去除停用词。之后，构成初始训练集。分别通过查询情感词词典、否定词词典和副词词典，对微博语句中的情感词按极性求均值，构成特征向量的前两维；对于否定词，统计语句中的否定词个数；最后统计副词的均值，构成一个完整的特征向量，根据微博自身特点使用svm训练情感倾向性模型，得岀每条微博的情感极性，实现基于svm的中文微博情感分析研究。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

3. 实施方案、进度安排及预期效果

实施方案：

一、绪论

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

4. 参考文献

[1] 姚天昉, 彭思崴. 汉语主客观文本分类方法的研究[c]. 第三届全国信息检索与内容安全学术会议论文集, 中国江苏苏州, 2007, 117-123.

[2] 丁晟春, 王颖, 李霄. 基于svm的中文微博情绪分析研究[j]. 情报资料工作, 2016(3): 28-33.

[3] 李霄. 基于内容挖掘的话题微博情感分析研究[d]. 南京理工大学，2015.

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码