基于数据挖掘的微博用户画像情感分析——以天津8.12事故为例毕业论文
2022-01-07 21:24:09
论文总字数:34455字
摘 要
用户画像在政府和一些官方机构了解用户情感、及时控制舆情走向同时控制用户情感走向的方面起着重要的作用,它可以精准识别具有不同情绪的用户并快速了解用户的意见,从而达到精准推荐微博和引导情感的作用。经过对有关用户画像文献的阅读后发现,以往的研究并没有做到立刻而直观的了解到用户情感倾向度的特点且不能了解每位用户的情感倾向程度,本文针对每一位用户构建情感倾向度的用户画像等相关问题展开进一步的研究探讨以及模型的构建。
第一,利用Python数据挖掘技术搜集有关微博热点话题的用户评论数据,并结合基于主题的用户画像和扎根理论的开放式编码方法将用户评论概念化和范畴化;第二,利用情感分析技术计算每位用户评论的情感分值,同时划分舆情传播阶段,从而及时的了解舆情传播各个阶段用户情感倾向,采取措施加快舆情从危机酝酿期向信息衰减期转换,提高控制舆情走向的效率;最后,编写预测用户情感分值的GBDT算法,达到在舆论热点事件发生前期及时预测用户情感而控制舆情走向。
提出一种基于主题的用户画像和扎根理论的开放式编码的方法,构建用户画像并了解用户情感倾向程度的新思路,将每一位用户较长篇幅的微博评论概念化为若干个标准的四字词语,从而在控制舆情走向的方面快速了解用户情感。在舆情控制方面有一定的理论意义和应用价值。
关键词:用户画像 情感分析 舆情传播 微博数据挖掘
Emotional Analysis of Micro-blog User Portraits Based on Data Mining
——Take Tianjin 8.12 Accident as an Example
Abstract
User portraits play an important role in the government and some official organizations to understand user emotions and control the trend of public opinion and control user emotions in a timely manner. Accurately identify users with negative emotions and quickly understand different opinions of users, so as to accurately recommend Weibo to guide emotion. After reading the literature about user portraits, it was found that previous research did not immediately and intuitively understand the characteristics of the user's emotional tendency and could not understand the emotional tendency of each user. This article builds an emotional tendency for each user. User portraits and other related issues for further research and model building.
First, use Python data mining technology to collect user comment data on Weibo hot topics, and combine theme-based user portraits and open coding methods to conceptualize and categorize user comments; second, use sentiment analysis technology Calculate the sentiment score of each user's comment and divide the stage of public opinion transmission to understand the user's emotional tendency in all stages of public opinion transmission in a timely manner, take measures to accelerate the conversion of public opinion from the crisis brewing period to the information decay period, and improve the efficiency of controlling public opinion; The GBDT algorithm for predicting user sentiment scores achieves timely prediction of user sentiment and rapid control of public opinion in the early stage of public opinion hot events.
It proposes a theme-based user portrait and an open coding method based on the theory to construct a new portrait of the user portrait and describe the user's emotional tendency, and conceptualize the long microblog comments of each user into several standard four Words and words, in order to control the direction of public opinion can achieve the purpose of quickly understanding the user's emotions. It has certain theoretical significance and application value in the control of public opinion.
Key words: User profile; Sentiment Analysis; Public Opinion; Weibo Data Mining
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 研究背景 1
1.2 研究目标和内容 2
1.3 研究方法和思路 2
1.4 论文创新点 3
第二章 文献综述 5
2.1 国内外关于用户画像的研究 5
2.1.1 用户画像构建的目的 5
2.1.2 用户画像构建的主要方法 5
2.1.3 用户画像研究评述 8
2.2 用户评论的情感分析研究 9
2.2.1 用户评论的预处理 9
2.2.2 用户评论情感分析的主要方法 9
2.2.3 用户评论情感分析研究评述 11
2.3 网络舆情演变分析 11
2.3.1 突发事件研究现状 11
2.3.2 网络舆情及其演变研究现状 12
2.3.3 网络舆情研究评述 13
第三章 天津“8.12”事故情感态势演化分析 14
3.1 数据获取及预处理 14
3.2 构建用户画像 15
3.2.1 开放式编码 15
3.2.2 主轴性编码 17
3.2.3 选择性编码 18
3.3 用户评论的情感分析 19
3.4 舆情演变阶段的划分 21
3.5 情感倾向度分析建模 23
3.5.1 数据编码处理 23
3.5.2 定性分析 24
3.6 本章小结 27
第四章 基于用户画像的突发事件微博舆情情感预测模型的评估 29
4.1 模型的构建 29
4.1.1 显著性检验 29
4.1.2 情感预测模型的构建 30
4.2 模型效果评价 33
4.3 模型效果分析 33
4.4 模型的应用前景 35
第五章 总结与展望 37
5.1 总结 37
5.2 研究的局限性与未来研究方向 37
参考文献 38
致 谢 43
第一章 绪论
1.1 研究背景
请支付后下载全文,论文总字数:34455字