面向食品安全论坛的爬虫技术研究毕业论文
2022-02-21 19:49:01
论文总字数:20614字
摘 要
近年来,随着电子商务和移动端app的兴起,外卖食品变成了人们生活必不可少的一部分,外卖因其投入小、收益高的特点,迅速普及了大片商家的入驻。面对大规模的餐营业的涌出,食品安全必然成为人们需要担心的重要问题。而且近些年来的食品安全问题层出不穷,消费者无疑是最大的受害群体,为了保障食品安全,完善相关法律,消费者对于食品的评论就显得十分重要了。我国对食品安全的整治力度虽然很大,但是信息的透明度并不高,希望通过网民对食品安全的切身评论,能对食品安全的现状做出改进。
本文通过网络爬虫来收集食品安全评论信息,并通过文本情感技术对评论进行文本情感分析,判断人们对食品的满意度,进而影响食品的安全性,最后得出结论。
本文从技术方面升入了解食品安全的重要性,以突显食品安全中的问题,警示消费者,
并对这些技术进行总结和展望。
关键词:网络爬虫 数据挖掘 语义分析 食品安全 网络论坛
Research on Reptile Technology and Text Emotion Analysis for Food Safety Forum
Abstract
In recent years, with the rise of e-commerce and mobile app, take-away food has become an indispensable part of people's lives ,because of its small investment, high income characteristics, the rapid spread of large businessmen settled. Facing the large-scale meal business gush,food safety must be an important issue that people need to worry about. And food safety problems have been endless in recent years, consumers are undoubtedly the biggest victims. In order to protect food safety, improve the relevant laws, consumers' comments on food are very important. China's food safety remediation efforts, although large, but the transparency of information is not high. Hope that through Internet users on food safety and personal assessment, to improve the status of food safety.
This article collects food safety reviews through web crawlers,and through the text of emotional technology to comment on the text of emotional analysis,judge people's satisfaction with food, and thus affect the safety of food, and finally concluded.
This article from the technical aspects into the understanding of the importance of food safety, to highlight the food safety problems, warning consumers,and summarize and forecast these technologies.
Keywords: web crawler;data mining;semantic analysis;food safety;Internet forum
目录
摘 要 I
Abstract II
第一章 绪论 1
1.1 课题来源 1
1.2 研究意义 1
1.3 研究思路和方法 2
1.4 研究准备 2
第二章 文献综述 4
2.1 国内外研究现状 4
2.1.1 网络爬虫技术简介 4
2.1.2 网络爬虫国外发展现状 5
2.1.3网络爬虫国内发展现状 5
2.2 爬虫对比分析 6
2.2.1 import.io 6
2.2.2 gooseeker 7
2.2.3 node.js 7
2.2.4 爬虫对比 8
2.3情感分析技术 9
2.3.1情感分析系统介绍 9
2.3.2情感分析国外发展现状 9
2.3.3情感分析国内发展现状 10
3.2.4 实现步骤 10
第三章 面向食品安全论坛的网络爬虫技术研究 11
3.1爬虫设计 11
3.2 运行结果 14
第四章 系统实现 15
4.1 可视化界面设计 15
4.1.1界面概念图 15
4.1.2 界面设计 15
4.1.3 ui界面运行结果 16
4.2 情感分析技术设计 17
4.2.1算法设计 17
4.2. 2 运行结果 20
第五章 总结与展望 22
5.1总结 22
5.2展望 22
参考文献 23
致谢 26
第一章 绪论
1.1 课题来源
本课题来源于团队课题“互联网 背景下食品安全消费者关注度研究”(得到“基于社会偏好的鲜活农产品质量安全激励机制研究(71301073)”国家自然科学基金项目的支持),该团队课题拟为食品安全管理和预警提供理论、方法和技术预研。课题选题知识涵盖面广,具有较高的实践应用价值。本人承担其中情感文本分析技术的开发,并据此研究成果和技术积累撰写本学位论文。
1.2 研究意义
近年来,伴随着网络信息的爆炸发展,移动端app的兴起,饿了么、美团等外卖app变得火热起来,人们的订餐需求日益加剧,只需要轻轻一点,所选的食物就会在短时间内送上门来,然而,许多商家为了追求利益,节约资本,不断的偷工减料,更有甚者添加不安全的添加剂,虽然商家利益得到了提升,随之而来的问题是食品是否干净、安全?随着今年“315晚会”对“饿了么”黑作坊的曝光,食品安全这一问题显得越来越重要。人们对食物的需求提升必须是建立在食物相对安全的基础上的。人们有权利知道自己买的食物是否安全,最好能有一个比较准确的判断。食品的安全性需要通过消费者切实的评论感受来加以判断,但是消费者的评论具有数量多和准确性有限的特点,所以必须需要一种技术来收集和分析这些数据。随着网络的兴起,越来越多的网站层出不穷,数据的收集与人力资源的消耗成正比,为了减少人力开支,就需要使用网络爬虫技术。网络爬虫能够自动翻页爬取需要的数据,存入数据库或者其他形式的文件,轻松的把需要的数据收集起来,方便研究分析,。一般评论有正面的也有负面的,可以借助文本情感分析技术进行自动判断,情感分析技术能够通过一段话里面关键的几个表明自己态度的词语通过加分减分的方式来给这段话打分,不同程度的消极或者积极的词语会给不同的分数,用分数来判断这句话是什么情绪的观点。以此来分析消费者对于食品的情感倾向观点。并由此来计算这些食品的消费者满意度,判断食品好坏。
本文就食品安全方面的问题利用网络爬虫来获取数据加以分析研究,旨在深化网络爬虫的实用性并且解释一些食品安全方面的问题。同时使用文本情感分析技术加以分析,以进一步发挥评论文本的作用。
1.3 研究思路和方法
主要研究内容:了解网络爬虫的基本原理,了解爬虫工作的步骤,根据需求数据的基本要求设计合适的爬虫脚本,并加以实现完善。然后使用情感文本分析技术判断文本情感倾向,最后分析所得到的数据,加以研究并得出结论。
请支付后下载全文,论文总字数:20614字