基于maskrcnn的服饰关键点检测开题报告
2022-01-14 20:22:37
全文总字数:6001字
1. 研究目的与意义及国内外研究现状
基于maskr-cnn的服饰关键点检测技术主要解决当下电商发展服饰种类数量增加,人工标注服饰的时间成本提高的问题。智能化自动提取服饰相关信息越来越重要,而服饰关键点定位检测技术是智能化提取服饰信息的基础,因此选择基于mask r-cnn的服饰关键点检测技术作为题,结合深度学习的知识使用maskr-cnn对服饰图片进行分类和关键点定位,有效提取服饰图片中的特征信息,实现有效的服饰分类和关键点定位的作用。在mask r-cnn的服饰关键点检测技术支持下,我们将跟方便快捷的实现服饰标注和分类,解决人力资源和时间,提高生产力和效率。国内外研究现状
基于mask r-cnn的服饰关键点检测技术的首要任务就是对人体姿态估计,人体姿态估计实质是人体相关关键点检测,我们可以借用相关模型对此次任务进行fine tune。
单人体姿态估计:
《flowingconvnets for human pose estimation in videos》iccv 2015
2. 研究的基本内容
1 基于mask r-cnn的关键点检测mask r-cnn经过较小的改动即可用来做关键点检测,首先为每个关键点生成一个单独one-hot 掩膜,并采用mask r-cnn预测k个mask,每个k个关键点类型都有一个mask。
对于一个实例的k个关键点,训练目标是一个热点mm二进制掩码,其中只有一个像素标记为前景(一个关键点对应一个mask,mask中只有关键点的位置设置为1其它设置为0)。
在训练期间,对于一个gt-keypoint,对mm个点采用softmax进行输出,并采用交叉熵损失函数。
3. 实施方案、进度安排及预期效果
1、实施方案:取5个类别,每张图片只标图片中的一类数据。分为:上衣、外套、半身裙、裤子、连身裙。一共24个关键点,每张图片只标一类衣服的关键点。整体的方法仍然是一个传统的自顶向下的处理流程,即现在图片中检测到人体,再做一个单人的人体姿态估计。按需求对图片进行裁剪对模型微调、屏蔽无关类别检测结果、类别间分开训练。
2、进度安排:实验时间安排在一九年四月初至五月初,解决包括环境搭建,程序编写,数据训练等问题。
3、预期结果:评分标准ne:
4. 参考文献
[1] k. he, x.zhang, s. ren, and j. sun, “spatial pyramid pooling in deep convolutional networks for visualrecognition,” in europeanconference on computer vision (eccv), 2014.
[2] 赵珊伟.基于深度网络的示例检索[d].北京邮电大学,2018
[3]r. girshick, “fast r-cnn,” in ieeeinternational conference on computer vision (iccv), 2015