登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 理工学类 > 自动化 > 正文

基于Python的爬虫与影评统计开题报告

 2020-05-05 17:12:19  

1. 研究目的与意义(文献综述包含参考文献)

随着互联网的普及和发展,在当今的网络空间电子数据量愈来愈大。

根据中国互联网络信息中心(cnnic)在京发布第42次《中国互联网络发展状况统计报告》。

截至2018年6月.我国网民规模达8.02亿,互联网普及率为57.7%;2018年上半年新增网民2968万人,较2017年末增长3.8%;我国手机网民规模达7、88亿,网民通过手机接入互联网的比例高达98.3%[1]。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容、问题解决措施及方案

本文的研究问题: 1. 采用python语言对指定电影的影评进行爬虫,快速收集大量影评文字信息; 2. 采用自然语言处理(nlp)算法,自动处理每条文本,判断影评发表者对电影的支持程度,分为0-5颗星。

0代表完全否定,5代表非常赞同; 3. 统计各影评者的打分,并于算法预测值进行比较; 4. 对预测值进行综合打分,并与豆瓣打分进行比较。

拟采用的研究手段: 1. 在爬虫方面采用python爬虫,python具有更高的开发效率,以及更强的开发功能python的标准库和第三方库强大到你无法想象,无论你想从事任何方向的技术编程,你几乎都能找到相应的库支持。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图