社交网络信息采集开题报告
2022-01-09 22:43:56
全文总字数:2171字
1. 研究目的与意义及国内外研究现状
随着信息技术的迅猛发展,参与到社交网络的人越来越多,人们乐于在网络中去分享自己的相关信息,拓展自己的人脉。企业甚至能通过社交平台去直接影响客户。社交网络有三个特性:其一、网络虚假信息与真实信息同时存在,其二、信息可以在网络中无限扩展,甚至最后影响到现实,其三、由于网络信息传递的爆炸性速度使得用户的信息很可能在短期内扩散。通过社交网络信息的采集并加以分析,企业能获得潜在的商机,如可以发现某个用户的活动商圈是否在企业的商圈覆盖范围内;可以知道某个用户的消费能力;可以知道某个用户的喜好及最近的购买习惯;可以知道某个用户会购买自己产品的概率;可以知道竞争对手的策略。还可以进行危机预警,消除潜藏的危机,同时,还可以进行效果预测,借助于社交网络的数据挖掘与分析制定出更精准、广泛、有效的社会化营销体系,更好的服务于品牌认知的建立及市场销售的提升。
2. 研究的基本内容
针对基于微信社交网络平台,利用采集在该社交网络的发帖、跟帖相关信息,按照分贴、分人、分地区、分时间进行数据集整理,采集数据在万条记录以上,形成可供大数据分析的原始数据集
3. 实施方案、进度安排及预期效果
实施方案 本次项目针对微信社交网络平台,利用微信公众号爬取所需信息并将之存入数据库中
第一步:了解网络爬虫的实现原理和实现技术
第二步:了解并掌握如何使用网络爬虫的库与框架
4. 参考文献
[1]王洪威. 主题网络爬虫的分析与设计[d].北京邮电大学,2013.
[2]赵俊. 社交网络的数据采集与分析方法研究[d].郑州大学,2015.
[3]徐雁飞,刘渊,吴文鹏.社交网络数据采集技术研究与应用[j].计算机科学,2017,44(01):277-282.