视觉引导的轮式机器人目标识别及跟踪毕业论文
2021-11-16 23:49:10
论文总字数:20341字
摘 要
随着机器人的日渐发展,计算机视觉,这一在机器人领域中的技术也渐渐变得重要了起来,计算机视觉这一技术目前广泛的应用于各种各样的领域。
本文对计算机视觉和就如何实现机器识别这个问题进行了研究,首先学习了计算机识别的基础卷积神经网络的基础知识,对如何使用神经网络做了初步的了解。而后设计实验,先使用labelimg软件制作自己的数据集,文中选用家里常见的电池作为识别目标,而后使用YoloV3平台对制作的数据集进行训练,训练后对数据集中的测试集进行检测。在训练数据集的过程中,使用了不同的学习率来测试神经网络的学习效果,通过对比发现了学习率并非越小越好,而是需要取适宜的值才能达到最好的效果。
最终通过测试发现,使用YoloV3神经网络训练数据集能够实现对测试集中的物体的正确识别,但是由于在给目标物体分类的时候选取了过于相像的物体,这导致了测试过程中出现了漏测错测的现象。
关键词:计算机视觉;卷积神经网络;YoloV3;数据集
Abstract
With the development of robots, computer vision, which is widely used in various fields, is becoming more and more important.In this paper, computer vision and how to realize machine recognition are studied. Firstly, the basic knowledge of convolutional neural network is studied, and how to use neural network is preliminarily understood.Then design the experiment, first use labelimg software to make their own data set, in this paper, select the common battery at home as the identification target, then use yolov3 platform to train the data set, after training, test the data set. In the process of training data set, different learning rates are used to test the learning effect of neural network. Through comparison, it is found that the learning rate is not the smaller the better, but needs to take the appropriate value to achieve the best effect.
Finally, through the test, it is found that using yolov3 neural network training data set can realize the correct recognition of the objects in the test set, but due to the selection of objects that are too similar when classifying the objects, which leads to the phenomenon of missing and wrong test in the test process.
Key words: computer vision; convolutional neural network; yolov3; dataset
目录
摘要 I
Abstract II
第1章 绪论 1
1.1研究的背景和意义 1
1.2国内外研究现状 2
1.3研究内容及预期目标 3
1.4 本章小结 3
第2章 基于深度学习的数据集的构建 4
2.1卷积神经网络 4
2.1.1激活函数 6
2.1.2 BP算法 7
2.2 数据采集与数据集的构建 8
2.2.1数据的采集 8
2.2.2构建数据集 11
2.3本章小结 12
第3章 基于YoloV3训练数据集 13
3.1.1Yolo神经网络模型 14
3.1.2 Yolo神经网络的loss函数 16
3.2 YoloV3神经网络 16
3.3 数据集的训练 17
3.3.1 搭建系统环境 17
3.3.2机器配置 20
3.3.3训练数据集 20
3.4本章小结 22
第4章 实验结果及分析 23
4.1不同超参数设置的比对结果 23
表4.1 学习率对训练数据集的影响 24
4.2检测识别过程 24
4.3识别结果图片 25
4.4本章小结 27
第5章 总结与展望 29
5.1全文小结 29
5.2 未来展望 29
致谢 31
参考文献 32
第1章 绪论
1.1研究的背景和意义
早在3000年前,人类就已经有了制造机器人这一设想。进入了20世纪后,随着现代科技的发展,机器人这一领域才算真正的发展起来。从人们制造出机器人一开始,智能化、拟人化就是人造机器人的最终方向,而这一方向不可避免的需要多种传感器从而达到拟人的效果,为了模仿人类,机器人将会使用包括视觉、触觉、力觉、滑觉、压觉、听觉、味觉、嗅觉、温度等反馈信息进行自我判断[[1]]。其中最重要的便是机器人视觉,这一人类最主要的环境感知来源。计算机视觉是一门研究如何让机器学会“看”的科学,通过一幅或多幅图像去认知环境物体,感知到物体的几何信息,进而对其进行描述、识别。处理等一系列操作。
计算机视觉自从计算机出现后,人类就一直试图发展它,但进度缓慢,直到进入了20世纪60年代,得益于计算机和电子技术快速发展,视觉传感器大规模应用,计算机视觉才开始了迅速的发展。Papageorgiou等[[2]]提出了静态图像中用于目标检测的一般框架, 直接从样本中学习特征, 不需要进行别的处理; Viola等[[3]]将积分图用于图像特征表达; Lowe[[4]]通过获取图像关键点附近的梯度信息来描述运动目标; Dalal等[[5]]提出了梯度直方图特征这个理论, 并且应用到解决静态图像的行人检测的问题上; Felzenszwalb等[[6]]将HOG与支持向量机(Support vector machine, SVM)相结合, 提出了可变形部件模型(Deformable part model, DPM),这项工作在2010年被授予了计算学习视觉目标分类(Pattern Analysis, Statistical Modelling and Computational Learning Visual Object Classes, PASCAL VOC)挑战赛[[7]]“终身成就奖”。由视觉引导的轮式机器人因为具有视觉目标识别以及追踪的功能,在智能化机器人领域具有广泛的应用和发展。在现代化自动化工业生产中,计算机视觉正逐渐变成一种至关重要的技术,通过这项技术,工厂可以提高生产线的生产效率,也可以保证生产线下的产品质量,如机械零件的自动检测、智能机器人控制和生产线的自动监控。移动机器人视觉导航等技术[[8]]。在一些国家级别的关键领域,计算机视觉也同样有着十分重要的意义。例如在国防方面,计算机视觉被广泛的应用于无人机之中,通过视觉传感器来实现目标信息的收集,通过目标识别及其追踪从而实现精确打击目标;在航天方面,月球探测车和空间站机器人同样也搭载了计算机视觉,像大名鼎鼎的“玉兔号”月球探测车,上面装配了大量的传感器,其中最重要的传感器之一便是视觉传感器,通过视觉传感器得以实现月球表面目标的识别及追踪,并将这些重要的数据传回地面控制中心。但是在计算机视觉这个技术领域当中,虽然现在比起上世纪这个概念刚出现的时候有了十分迅猛的发展,但是以目前的技术,还是无法让机器拥有像人类一样的视觉系统,因此这个问题值得人们去长远的研究发展。
1.2国内外研究现状
国外对于基于计算机视觉目标识别与追踪的研究开展较早,因此在理论研究和相关机器的制造方面均取得了许多成果,其中不少成果已经应用到工业机器人当中。相较于国外,我国对于计算机视觉的研究起步较晚,在众多的科学家科研人员的共同努力下,也取得了不少成果,并且也已经应用到了众多领域之中,但是和国外相比还是有一点差距的。
- 国外现状
德国库卡研究院(KUKA)研究并创建了库卡机器人视觉系统,用计算机来实现对三维环境的识别,实现对被观察者的外部特征、离开观察点的距离、质地和运动特征的理解,目前主要应用在医疗手术和工业检测方面。同时VMT公司则基于视觉识别,开发了冲压送料零件定位和位置调整机器人处理系统,使整个生产线更加的智能化,更具有效率。
瑞士的ABB则研究开发出了True View系统,该系统中的EVF软件平台包含了简化校准操作的Auto Cal等多种具有独特优势的先进技术,可以实现快速、可靠集成的Acc Train和Accu Test。同样属于瑞士的史陶比尔工业集团则开发出了移动式机器人系统HelMo,使用了AGV平台搭载工业机器人,允许使用三台内置激光扫描仪持续监测系统环境,从而实现完全自主地路线导航而同时确保导航的精确度以及人机交互安全性。
请支付后下载全文,论文总字数:20341字