针对哔哩哔哩弹幕网的舆情信息采集系统的分析与设计开题报告
2022-01-14 21:13:14
全文总字数:2748字
1. 研究目的与意义及国内外研究现状
随着互联网使用人数的不断增多,更多的人可以在互联网的平台上发表他们的评论,这些评论可能包括对某一事物的喜好,对某一时事的评讨,对某个知识的讲解或解释,当然还有可能会有居心叵测的人发表煽动人心的言论。无论这些言论价值观是普世的还是负面的,随着数量的增多,如果不能合理的对其分析和引导,将会是一个非常大的隐患。这也要求政府和互联网企业做好舆情的监控和引导。这也是本系统分析设计的一个非常重要的原因之一,这个原因也是主要原因。
由于在互联网上发表言论的人,多是匿名的或半匿名(半匿名指发表言论者如果未主动透露自己的信息,普通网民无法知道发表言论者的真实身份,只能知道其昵称,但是施行互联网实名制的互联网平台方是能够知道的)的,所以这些言论更能表达言论者内心的真实想法,这比线下的民意调查要更加的有价值。这也是本设计本系统的另一个原因。
2. 研究的基本内容
本次设计分析并设计了一个针对哔哩哔哩弹幕网,基于爬虫的,面向开发者和研究人员的舆情信息采集系统。主要内容为开发运行环境的搭建与测试,需求及技术分析,系统详细设计及实施,最终总结。主要涉及到了以下几个计算机相关的领域:Web安全与测试,App安全与测试,Web开发,跨平台GUI开发,数据分析。涉及的技术更是有:正则表达式,爬虫及反爬虫(反反爬虫)技术,基于xml的GUI设计,中间人攻击,xpath等。
3. 实施方案、进度安排及预期效果
方案主要分为三步,即环境的部署,各模块的分析实施,最后的整合发布。
整个设计过程在一个月内完成。
1.第一周进行对国内外采集系统和爬虫的研究,总结和本次设计的目标和具体需求;
4. 参考文献
[2] myers d, mcguffee j w. choosing scrapy[m]. 2015.
[3] 陈利婷. 大数据时代的反爬虫技术[j]. 电脑与信息技术, 2016, 24(6):60-61,共2页.
最新文档
- 性能优化的FRP护套用于钢筋混凝土框架的抗震改造外文翻译资料
- 圆形截面的FRP约束混凝土:审查和评估应力应变模型外文翻译资料
- FRP约束混凝土的轴向压缩行为:实验测试数据库和面向设计的新模型外文翻译资料
- 腐败与美国各州收入不平等之间的关系:来自专家小组的协整和误差修正模型的证据外文翻译资料
- 利用污泥和低质粉煤灰制备高强度陶粒外文翻译资料
- 表面活性剂改性疏水性Cu2O量子点作为高效钙钛矿太阳能电池顶部空穴传输材料外文翻译资料
- 内蒙古1962 – 2016年时间序列气候变量的变化特征外文翻译资料
- Nb 和 Ni 共掺杂 Mg(0001)氢解离扩散的理论研究:外文翻译资料
- 基于 Jetson Nano 深度学习平台的学生课堂学习评估系统—–学生的人脸检测与识别外文翻译资料
- UI 和 UE 设计技术及其在 HTML5 网站开发中的地位的研究外文翻译资料
- 皇后大道大桥——NEXT梁外文翻译资料
- 连续梁桥支座附近的波纹钢腹板抗剪性能评估外文翻译资料
- 在200至300℃的温度下纤维素的水热降解外文翻译资料
- 残差修正法在季节性ARIMA电力需求预测中的应用:以中国为例外文翻译资料
- 注蒸汽井中硅含量对水泥石抗压强度的影响外文翻译资料