登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 理工学类 > 自动化 > 正文

基于SVM的中文微博情感分析研究开题报告

 2022-01-25 23:21:31  

全文总字数:4039字

1. 研究目的与意义及国内外研究现状

我们可以从很多渠道获得网络信息,其中,主要的渠道是微博,各大论坛,新闻,评论等等。如果不对复杂的海量信息进行梳理,即使人们可以在网络上下载到资料,也很难获取到有价值的信息。没有经过处理的数据,只是一堆毫无意义的符号。只有在经过细化和分析之后才能得到其中有用的信息。人们才可以在通过阅读文档时形成自己的看法。收集、阅读和评论的工作在遇到海量的网络信息时会变得极其繁重复杂。在这个时候,对文本情感分析的研究就应运而生,它为人们提供了一套自动总结的系统,更好地有助于人们完成任务。

对文本的情感分析研究,具有实用的价值。在商业上,合理地运用文本情感分析研究,可以帮助企业更好、更便捷地去分析市场,处理客户的反馈等等。企业可以在微博营销和处理客户关系以及宣传时提高自身效益。生产厂家可以在用户对产品体验后,做出的评论中快速收集有用的信息,反馈到产品的制作过程中,从而提高市场竞争力。同时,政府部门可以搭建舆论分析的系统,从而领导们能够在最短的时间内,了解到群众对政府政策的反响。相关部门可以在突发的意外事件发生之后,及时有效地对群众的心里进行监测控制。此外,对某些特定人群做情感分析研究,也能够更有针对性地疏导他们的心理。

在海量的微博信息面前,凭借人工的力量去了解掌握用户的情感倾向,是一件极其繁重困难的事。研究怎样在微博中了解用户的情感倾向,在未来会是十分有意义的行为。基于这样的研究目的和意义,本文针对微博文本数据,建立基于svm的文本极性分类器,采用机器学习的方法,展开对微博情感分析的研究。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

首先,对从网络上搜集的微博语句进行预处理,去除空格等符号,用jieba中文分词工具对收集的微博观点句进行分词处理,再通过stopwords 、哈工大停用词表和四川大学机器智能实验室停用词库去除停用词。之后,构成初始训练集。分别通过查询情感词词典、否定词词典和副词词典,对微博语句中的情感词按极性求均值,构成特征向量的前两维;对于否定词,统计语句中的否定词个数;最后统计副词的均值,构成一个完整的特征向量,根据微博自身特点使用svm训练情感倾向性模型,得岀每条微博的情感极性,实现基于svm的中文微博情感分析研究。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 实施方案、进度安排及预期效果

实施方案:

一、绪论

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] 姚天昉, 彭思崴. 汉语主客观文本分类方法的研究[c]. 第三届全国信息检索与内容安全学术会议论文集, 中国江苏苏州, 2007, 117-123.

[2] 丁晟春, 王颖, 李霄. 基于svm的中文微博情绪分析研究[j]. 情报资料工作, 2016(3): 28-33.

[3] 李霄. 基于内容挖掘的话题微博情感分析研究[d]. 南京理工大学,2015.

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图