基于视频的人体跟踪定位研究文献综述
2020-04-03 11:53:05
文 献 综 述
一、本课题的意义:
随着计算机技术的不断发展,计算机能力得到了极大的提高,使得利用计算机实现人类的视觉功能成为目前计算机领域最热门的课题之一。该领域称之为计算机视觉,它是计算机技术,电子信息工程,微电子技术等多学科的一个共同的衍生点,是一门新兴的技术。
计算机视觉研究的目的是使计算机具有通过图片(和静止的图片相比,运动图像包含了更多的信息)认知周围环境信息的能力,这种能力不仅能使计算机感知环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且对它们进行描述、存储、识别与理解。
视频图像分析是计算机视频领域研究的一个基础支撑,基本上所有与计算机视觉领域有关的前沿方向都会对原始视频数据做分析处理,比如模式识别需要对原始视频图像进行分类,图像检索需要对其进行关联,图像压缩需要多其进行编码解码,视频跟踪问题则需要对其进行检测、识别、和跟踪。
视觉跟踪技术是计算机视觉界的一项研究热点。它是通过摄像头来模拟人的视觉功能:计算机或中央处理单元来模拟人的大脑,把通过摄像头获得的视觉信息预处理(去噪,加强有用信息,离散化)后,进行运动目标检测,分割,识别,然后对特定目标进行监视[1][2][3]定位和跟踪,对特定动态场景中的异常行为(如停车场内反复徘徊的行人,军事边境线上运动轨迹比较神秘的个体等)触发警报系统。
视觉跟踪系统用途广泛,目前它已经应用于计算机视觉界的许多领域,如;楼宇监控、公共安防、智能机器人的开发和研究、计算机人机交互界面、自动导航系统的设计与开发等。
视觉跟踪技术具有广泛的应用前景,并不仅仅局限于上述所介绍的几个方面。实现一个具有鲁棒性、准确的视觉跟踪系统是当前视觉跟踪技术努力的方向。随着计算机技术的不断发展,视觉跟踪技术作为计算机视觉领域中的核心技术之一,在一些关键技术中具有越来越重要的作用。
二、国内外研究现状:
随着视频分析的硬件的发展(包括视频获取设备如摄像头,图像采集卡,处理器和计算机等),基于视频信息的分析迅速渗透到人民生活的各个方向。巨大的商业价值和应用价值使越来越多的公司和研究机构致力于这种技术的研究。美国,英国等国家已经展开了大量相关项目的研究。1997年,美国国防高级研究项目署DARPA(Defence Advanced Research Projects Agency)领头,以美国卡耐基梅隆大学为首,麻省理工学院等高校参与了视频安全与控制(VSAM)[4][5]的研究开发,并与2000年基本完成。此项目主要研究的是针对战场及普通民用场景进行监控的自动视频理解技术:分布于各个不同位置的摄像头获取的视频信号通过一个分布式的网络连接汇集到操作中心,只需要一个操作员就可以监控一个相当广阔的空间范围。同时在很大程度上减少了操作人员的劳动强度,系统能够自主检测异常情况的发生,而且只有在检测到异常的情况下系统才会发出信号,提醒操作人员作出相应的处理。