计算机类ESI数据采集系统设计开题报告
2021-12-19 18:39:59
全文总字数:1638字
1. 研究目的与意义及国内外研究现状
本课题的目的是:
实现一个数据自动采集系统,用于图书馆,各科研单位和管理部门跟踪科研动态,分析各项指标。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容
研究思路:
利用基于学术搜索引擎的科研文献信息的自动获取技术获得的信息。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 实施方案、进度安排及预期效果
实行方案:
使用scrapy爬去esi的数据,清洗整理后存入mongodb,使用python相关的科学计算和可视化包进行数据的简单展示,同时提供简单的前台管理页面,用于监控进度,查询数据集,显示报表。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 参考文献
[1]bin fan, david g. andersen, michael kaminsky , michael d. mitzenmacher . cuckoo filter: practically better than bloom .changsha:cs.cmu.edu.2014
[2]苏旋.分布式网络爬虫技术的研究与实现.哈尔滨:哈尔滨工业大学,硕士学位论文,2006
剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付