简单搜索引擎的设计与实现任务书
2021-12-26 16:08:19
全文总字数:1638字
1. 1. 毕业设计(论文)的内容、要求、设计方案、规划等
本毕业论文的内容为设计并实现一个简单的搜索引擎系统,搜索引擎是指根据一定的策略,运用特定的计算机程序搜集互联网上的信息,在对信息进行处理和组织后,为用户提供检索服务的系统。结合搜索引擎的原理系统需要实现以下几个个重要模块:信息爬取或维护模块、预处理模块、建立索引模块(index)、查询模块。针对这几个模块系统需要使用以下几种技术实现:使用Heritrix网络爬虫模块抓取网页,使用Htmlparper对网页做预处理处理、使用Lucene对内容建立索引,同时使用Lucene的查询API提供信息查询模块。具体要求:
(1)开发语言为Java,后台数据库使用mysql,开发一个基于Lucene搜索引擎的搜索应用。
(2)按照软件工程的思想,设计开发本项目。
(3)实验测试数据要求有效且符合常规,结果分析要求实事求是。
(4)参考南京林业大学本科毕业论文撰写规范,撰写完整规范的学位论文。论文前言应包括:本课题研究的背景,研究目的和意义,研究的内容和思路等。论文正文中要包含系统主要界面图,论文的附录中应包含相关程序代码。论文结论应反映个人的研究工作成果,要求简洁明确、措辞严谨。
(5)准备答辩的演示文稿。
(6)进度安排:
序号 | 项目 | 时间 | 阶段成果 |
1 | 背景研究 | 2周左右 | 文献综述,开题报告 |
2 | 熟悉开发环境及语言 | 3周左右 | 开发计划及技术方案 |
3 | 搭建开发及测试环境 | 1周左右 | |
4 | 需求分析 | 1周左右 | 界面及数据库设计报告 |
5 | 编写源代码 | 4周左右 | |
6 | 系统测试及完善 | 1-2周左右 | |
7 | 撰写论文 | 2周左右 | 毕业论文 |
8 | 准备答辩材料,答辩 | 1周左右 | 答辩演示文稿 |
2. 参考文献(不低于12篇)
[1] 徐宝文,张卫丰.搜索引擎与信息获取技术.清华大学出版社,2003
[2] 于天恩.lucene搜索引擎开发权威经典.中国铁道出版社,2008
[3] 卢亮,张博文.搜索引擎原理、实践与应用.电子工业出版社,2007