登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 计算机科学与技术 > 正文

新浪微博互动预测方法的研究文献综述

 2020-04-15 09:37:16  

1.目的及意义

近年来,Internet的发展给人们提供更方便、更快捷的通信手段和信息获取方式,人们足不出户就可以看到世界的模样,在家就可以享受全球资源。互联网给我们提供了各种多媒体交互性服务,远程医疗,在家办公,网上购物颠覆了人们的生活模式,使不管有多远的人们感觉越来越近。世界逐渐进入个人互联网时代。

社交媒体的出现驱动了个人互联网时代的发展,大家耳熟能详的社交媒体有Facebook、Twitter、微信、QQ、新浪微博、腾讯微博等等。新浪微博是当下热门的人际互动平台,正如它的标语“随时随地发现新鲜事”,在这个平台上将会爆发大量实时的数据。据调查,第40次《中国互联网络发展状况统计报告》数据显示,截至2017年6月,中国网民规模来到7.51亿,每天产生上亿条微博内容。是国内最有价值的社交平台之一。在营销方面,因为社交媒体上都是广大民众所思、所想、索要的信息,这是最珍贵的用户信息,传统的市场调查和市场营销是无法与之相提并论的。由于新浪微博用户量、信息的真实性、加上这种为用户提供全新的休闲娱乐和人际交往方式成为了一种在很多方面优于现有的媒体的营销平台。用户获取信息的成本得到极大的降低,传统的营销方式对用户的影响正在不断的减少。

在国外,H.Kwak等分析了Twitter网络,研究结果表明Twitter网络是一个社会媒体与社交网络的混合体,但更倾向于社会媒体网络而不是社交网络。Romero等分析了Twitter不同类 型的主题微博传播机制,发现不同主题微博的曝光次数将不一样,含有政治内容的微博曝光次数越多越容易传播,而含有 一些新兴的词汇的微博曝光次数增多会导致传播下降。B.Krishnamurthy等分析微博粉丝量与关注度之间的联系。Cha等人针对微博用户的粉丝量、转发数、参考数三个微博特征进行了分析和对比。Boyd D等人研究了 Twitter的转发行为、转发动机、以及被转发的微博的主题进行了分析,但并没有预测。国外研究成果相对来说要比国内丰富,且有关用户行为的研究都集中在转发行为。

在国内,Z.Luo等研究了新浪微博转发行为,研究表明微博更加容易在朋友、亲戚等强连接以及权威人士连接关系中转发,另外研 究表明女性用户更容易转发来自于朋友等强连接的用户,而 男性用户则相反.Z.Yang等基于Twitter微博转发的特 征,提出了一个因子图预测模型。吴维、张珊等人提出了有关微博情感分析的方法,平亮等人提出了判断用户类别的方法。崔争艳、刘志明研究了在微博短信的主题基础上进行分类的方法及如何提取特征。

总之,有关微博用户行为预测的研究比较少,单单只是集中在转发上,而没有在评论,点赞,转发的完整要素上进行研究。而用户行为的分析预测直接关系着企业微博的营销活动,甚至可以说是企业的生命线,因此,微博用户行为的研究成为额当前的热点问题,这也是新浪携手阿里在全球寻找用户行为预测方案的原因所在。

这项研究不论是对政府部门还是对私有企业都意义重大。对政府部门,及时获得用户对社会的焦点问题并准确判断舆论的热点问题,以便及时采取控制和引导。例如,支付宝中的“寻人启事”、微博中的“爱心捐助”等等都有利于社会的发展。对企业而言,可以准确把握用户的兴趣、爱好和特点,及时的知道企业产品和服务定位、来不断完善企业的产品来提高社会竞争力等等。

因此研究微博用户的在线行为,无论是在企业快速占领市场方面或者拉近与终端消费者距离方面,还是在政府部门对舆论的监管和引导方面都有着重要的意义和作用。{title}

2. 研究的基本内容与方案

{title}

基本内容:

首先,分析研究文本分词技术,包括向量空间模型、中文分词技术、特征选择方法、特征权值计算方法。其次,研究文本分类算法,包括类中心向量算法、逻辑回归模型、KNN 算法。第三,讨论了有关模糊集有关知识。

围绕阿里天池中平台提供的130万条训练数据,使用统计聚类的方法做分析:首先统计了数据集中转发、评论、点赞三个用户行为均为0的微博数量与至少有一个行为不为0的微博数量比例关系。转发、评论、点赞都不为0与至少有一个行为不为0的微博数量比例关系。将这两个比例关系作为第一个评价结果影响因子。其次分析了三种用户行为与微博数量分布的关系作为第二哥评价结果影响因子。;第三,分析了三种用户行为的聚类系数及平均距离的特点,从而论证了用户行为存在中心点。第四,分析了微博本身的特点,并结合 TFIDF 理论、信息增益理论与模糊集理论分析了如何抽取微博特征词的问题;最后,从微博所创时间的角度分析了时间与微博用户行为的联系。

最后研究分析了如何使用新类中心向量算法计算每个用户中心向量;其次,用类别集合代替传统的欧几里德或曼哈顿距离,改进 KNN 算法,结合用户中心向量实现对用户行为的预测功能;第三,构建了预测结果评价模型;第四,在前三步基础上,构建了预测模型。并且通过阿里天池平台提供的的评分模型来评价。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图