基于OpenCV的手势识别与模拟鼠标控制系统设计与实现开题报告
2021-03-10 23:56:16
1. 研究目的与意义(文献综述)
随着计算机技术的飞速发展,人机交互技术成为了互联网时代最热门的课题之一。人机交互技术最早提出是在1959年,关于计算机控制台设计的人机工程学——从人在操纵计算机时如何才能减轻疲劳出发,研究的是人如何适应计算机。一直到20世纪90年代后期,随着高速处理芯片,多媒体技术和internet web技术的迅速发展和普及,人机交互的研究重点放在了智能化交互,多模态(多通道)-多媒体交互,虚拟交互以及人机协同交互等方面,也就是放在以人为在中心的人机交互技术方面。
人机交互的历史发展是从人适应计算机,到计算机去适应人这一过程,从早期的手工作业阶段、作业控制语言及交互命令语言阶段、图形用户界面(gui)阶段、网络用户界面阶段,发展到如今多通道、多媒体的智能人机交互阶段,经历了半个世纪的轮回转换。
而计算机视觉,在人机交互技术中是极其重要的方面。计算机视觉,顾名思义,是一门关于使计算机如何“看”的科学。进一步讲,就是利用摄像头和电脑来代替人眼对目标进行识别、跟踪、检测等等,并进一步对图像进行处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。而opencv则是计算机视觉领域常用的跨平台计算机视觉库。
2. 研究的基本内容与方案
本文的主要研究内容是在vs2013环境下基于单目摄像头采集手势,并借助opencv开源视觉库对不同手势(如“拳”和“掌”)进行识别及处理。当检测到手掌移动时,鼠标跟随手掌移动,手握拳时鼠标状态为点击左键,手张开时鼠标状态为放开左键。
由于不同的手势具有不同的表达意义,分类标准也不同。根据世界著名心理学家pavlovic对人类手势的深入研究,从常用功能上将手势分类为无意义手势和有意义手势,其中有意义手势包括控制手势和交流手势,交流手势又包括符号(静态)手势和动作(动态)手势。手势识别从手势运动的时间与空间差异性上可以分为静态手势识别与动态手势识别;根据识别方法,可以分为根据模板匹配与基于机器学习;根据信息采集设备不同,可以分为基于数据手套采集和基于单目(多目)摄像头采集的手势识别。
手势识别首先要进行数据图像的采集。手势建模的选取和建立十分重要。在手势识别之前要进行手势分割,即所谓的手势检测,需从摄像头中获取的包含手势的图像信息中提取手势部分。其技术可分为两类:基于肤色的检测的分割和基于运动分析的分割。
拟采用的技术如下:
3. 研究计划与安排
第1-4周:查阅相关中、英文文献资料,明确研究内容。确定设计方案,完成开题报告,完成不少于2万字符的英文翻译任务;
第5-6周:完成论文开题工作。
第7-10周:完成手势识别与模拟鼠标控制系统的设计与调试,并撰写部分论文初稿;
4. 参考文献(12篇以上)
[1]baggio, daniel lélis. opencv 3.0 computer vision with java [m]. packt publishing ltd, 2015.
[2]shrivastava, rajat. a hidden markov model based dynamic hand gesture recognition system using opencv [c]. in advance computing conference (iacc), 2013 ieee 3rd international, pp. 947-950. ieee, 2013.
[3]关然,徐向民,罗雅愉,苗捷,裘索. 基于计算机视觉的手势检测识别技术[j]. 计算机应用与软件. 2013(01)