面向Web Services的网络爬取系统设计与实现任务书
2020-06-25 20:48:36
1. 毕业设计(论文)的内容和要求
选题背景:
web服务技术作为时下soa思想的最佳实现方式,己成为产业界和学术界热门研究方向,并在近年来”软件即服务”思想广泛影响下,以”以服务为中心”的互联网络正在形成,在此条件下,如何更智能,更大范围的发现互联网上的web服务成为”服务互联网”(internet of service)得以构建成型和发展的关键。
手动方式发现能够完成复杂业务的web服务的方法既笨拙又会消耗大量的人力。通用搜索引擎可以帮助软件开发人员找到与搜索条件相关联的网站,并非用户所需要的所有相关信息,而且这些信息可能更多的来自于不同的网站,而不是将一个网站中所有相关信息都返回给用户。再者,通用搜索引擎返回的结果中相当一部分并不是wsdl文件,尽管它们以wsdl作为文件后缀名。因此,通用搜索引擎查询的这些零散的服务信息不能很好地支持web service,需要对这些信息进行分类、去除冗余、整合等一系列繁琐的步骤,这大大地降低了web服务发现的效率。
2. 参考文献
[1]王俊生,施运梅,张仰森.基于 hadoop 的分布式搜索引擎关键技术[j].北京信息科技大学学报(自然科学版),2011,26(4):53-56.
[2]罗刚.网络爬虫全解析#8212;#8212;技术、原理与实践[m].北京:电子工业出版社出版,2017.
[3]宋海洋,刘晓然,钱海俊.一种新的主题网络爬虫爬行策略[j].计算机应用与软件,2011,28(11):264-266.
3. 毕业设计(论文)进程安排
起讫日期 |
设计(论文)各阶段工作内容 |
备 注 |
2017-12-15~ 2017-12-22 |
确定搞清题目的要求,查阅参考文献并开始考虑系统总体方案 |
同时着手准备开题报告 |
2017-12-23~ 2018-2-20 |
完成并上交开题报告,并开始进行系统总体设计。(中间包括寒假) |
|
2018-2-26~2018-3-13 |
完成系统的总体设计,包括软件的总体设计和完成数据库的概念设计。 |
|
2018-3-16~2018-3-28 |
完成数据库的详细设计,包括各数据表的设计和数据的录入 |
数据库平台自选 |
2018-4-1~2018-4-20 |
着手编制有关程序,并完成主要模块的设计 |
软件开发工具自选 |
2018-4-21~2018-5-1 |
完善主要模块的功能并完成其他模块的设计,并准备一个可供中期检查的演示版本。 |
|
2018-5-2~2018-5-4 |
完成各模块的单元测试,完成整个系统的调试工作,并着手毕业论文(设计)的撰写工作 |
|
2018-5-5~2018-5-20 |
完成论文的初稿,并通过电子邮件发给指导老师初审 |
|
2018-5-20~2018-6-5 |
按指导老师意见修改论文并定稿打印装订 |
递交论文及相关材料 |
2018-6-5~2018-6-9 |
准备毕业论文的答辩,包括答辩演示文稿等 |
|
2018-6-10~2018-6-13 |
论文答辩 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|