基于百度热点查询的数据抓取开发开题报告
2022-01-14 21:27:20
全文总字数:1127字
1. 研究目的与意义及国内外研究现状
随着互联网的迅速发展, 搜索引擎上的信息丰富多样, 但是大量的信息对用户造成了一定的困扰, 输入一个简单的关键字出现成千上万条信息,用户很难在其中找到自己所关也的信息,因此,如何从大量的web信息中提取用户感兴趣的数据是目前急需解决的问题。
为了能够在大量的互联网信息中,提取出对自己有价值的信息,并将提取出的地理文本信息进行处理,所以需要对web进行文本提取,然后提取出地理文本信息,并将其进行转化,从而更好的为用户提供数据共享和位置服务。
国内外研究现状
目前,有很多关于研究网页正文内容提取方法。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容
3. 实施方案、进度安排及预期效果
基于百度地图公开API,开发出软件框架,实现对特定区域的相关热点数据抓取,并将热点数据组成的向量予以持久化存储。
4. 参考文献
基于互联网位置服务的文本信息搜索技术研究[D].魏运运. 武汉工程大学.2015基于文本地理信息提取的平台服务与应用研究[D]. 周锐.成都理工大学 2014基于统计的网页正文信息抽取方法的研究[J]. 孙承杰,关毅. 中文信息学报.2004基于Google Maps API和网络数据抓取技术的WebGIS开发.刘志辉,许挥卫.测绘通报.2009基于标记窗的网页正文信息提取方法[J].赵欣欣,索红光,刘玉树.计算机应用研究.2007(03)
剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付
最新文档
- 性能优化的FRP护套用于钢筋混凝土框架的抗震改造外文翻译资料
- 圆形截面的FRP约束混凝土:审查和评估应力应变模型外文翻译资料
- FRP约束混凝土的轴向压缩行为:实验测试数据库和面向设计的新模型外文翻译资料
- 腐败与美国各州收入不平等之间的关系:来自专家小组的协整和误差修正模型的证据外文翻译资料
- 利用污泥和低质粉煤灰制备高强度陶粒外文翻译资料
- 表面活性剂改性疏水性Cu2O量子点作为高效钙钛矿太阳能电池顶部空穴传输材料外文翻译资料
- 内蒙古1962 – 2016年时间序列气候变量的变化特征外文翻译资料
- Nb 和 Ni 共掺杂 Mg(0001)氢解离扩散的理论研究:外文翻译资料
- 基于 Jetson Nano 深度学习平台的学生课堂学习评估系统—–学生的人脸检测与识别外文翻译资料
- UI 和 UE 设计技术及其在 HTML5 网站开发中的地位的研究外文翻译资料
- 皇后大道大桥——NEXT梁外文翻译资料
- 连续梁桥支座附近的波纹钢腹板抗剪性能评估外文翻译资料
- 在200至300℃的温度下纤维素的水热降解外文翻译资料
- 残差修正法在季节性ARIMA电力需求预测中的应用:以中国为例外文翻译资料
- 注蒸汽井中硅含量对水泥石抗压强度的影响外文翻译资料