基于深度学习的风格美化app毕业论文
2021-12-21 21:38:28
论文总字数:19156字
摘 要
全球人工智能行业发展迅猛,自2006年深度学习算法被提出,第三次人工智能浪潮出现了,伴随着2012年起数据的爆发式增长,人工智能产业迎来高速发展,有了大量数据后深度学习在图像以及语音处理上实现突破性进展,人工智能逐渐逐渐从实验室走了出来,真正的用于商业中。截止到2019年,全球人工智能市场规模以达5000亿美元,这一数字仍在不断攀升,预计在2025年将达到3.5万亿美元。从人工智能涉足的领域来看,家居、金融、客服、机器人、无人驾驶、医疗、教育、农业、制造业都有人工智能的身影。其中主要的应用场景主要集中在图像处理。
本篇论文针对深度学习在图像处理上实现的风格转换。使用python搭建了实时风格转换的网络模型,包括其训练,测试以及模型格式转换和压缩部分。安卓部分使用Java设计了围绕在本地移动端实现实时风格转换功能的app,主要包括对手机相册的访问,用于选择用户想要进行风格转换的内容图片;风格转换模型的切换功能,用户可以自由选择自己想要的风格;图片保存功能,用于将风格转换后的图片保存到本地。在app主界面还提供了对原内容图片和转换后图片的对比功能,方便用户对比转换效果。
关键词:深度学习;Android;风格转换;JAVA;Python
Style-transfer app based on deep learning
ABSTRACT
The global artificial intelligence industry is developing rapidly. Since the deep learning algorithm was proposed in 2006, the third wave of artificial intelligence has appeared. With the explosive growth of data since 2012, the artificial intelligence industry has ushered in rapid development, with a large amount of data depth Learning to achieve breakthroughs in image and speech processing, artificial intelligence has gradually come out of the laboratory and is truly used in business. As of 2019, the global artificial intelligence market has reached 500 billion US dollars. This number is still rising. It is expected to reach 3.5 trillion US dollars in 2025. From the field of artificial intelligence, household appliances, finance, customer service, robots, driverless, medical, education, agriculture, and manufacturing all have artificial intelligence. The main application scenarios mainly focus on image processing.
This paper focuses on the style conversion of deep learning in image processing. Using python to build a real-time style conversion network model, including its training, testing and model format conversion and compression part. The Android part uses Java to design an app that implements real-time style conversion functions on the local mobile terminal, mainly including access to mobile phone albums, used to select the content pictures that the user wants to perform style conversion; the style conversion model switching function, users can freely Choose the style you want; the picture save function is used to save the style converted picture to the local. The app main interface also provides a comparison function between the original content picture and the converted picture, which is convenient for users to compare the conversion effects.
Keywords: Deep Learning; Android; Style-Transfer; JAVA; Python
目录
摘 要 2
ABSTRACT 3
第一章 绪论 5
1.1 本文研究意义 5
1.2 基于深度学习的风格转换研究现状 6
1.2.1 卷积现状 6
1.2.2 风格迁移现状 7
第二章 神经网络介绍 8
2.1 神经网络发展历史 8
2.2 卷积神经网络介绍 11
2.2.1 卷积神经网络和人类视觉系统的联系 11
第三章 风格迁移 19
3.1 风格迁移方法 19
3.2 系统架构 22
3.2.1 神经网络 22
3.2.2 安卓端 22
第四章 网络模型训练及安卓搭建 23
4.1 数据集 23
4.1.1 数据集介绍 23
4.1.3 数据集的意义 24
4.1.3 数据集的大小和版本 24
4.2 实验过程 25
4.3安卓端搭建 28
4.4 系统展示 31
总结和展望 37
参考文献 38
第一章 绪论
1.1 本文研究意义
风格化的摄像如今很受大家欢迎,几个现象级的应用诸如抖音,Instagram,美图秀秀都是抓住了用户对于在社交平台是分享的照片和小视频美化的这一需求。现在的年轻人不再满足于使用手机的摄像头拍摄出的照片,尽管现在的手机像素直逼单反,但是他们还是希望通过一些辅助软件让自己的照片或者小视频看起来更有吸引力,女生则希望通过例如美图秀秀的软件让自己看起来更白,脸更瘦眼睛看起来更大,男生希望通过抖音的各种特效让自己的小视频像电影片段一样。
随着计算机视觉在风格化这一方向的不断发展,在2015年,一项人工智能与艺术的又一碰撞走进人们的实现——图像风格迁移。这项技术所能带给所有摄像爱好者的,不仅仅是在拍照的时候瘦脸,加兔耳朵,等等这些小特效,而是可以将照片完全风格化,选择自己喜爱的风格,在很短的时间内可以得到非常神奇的效果。而这一技术虽然在近几年发展迅速,但实际运用于市场上的应用却不多,在app store上有著名的prisma,但是Android应用市场上却很难找到同类别应用。这样一项可以极大提高社交网络内容丰富性的技术没有被足够多的用户所接触显然是很可惜的。本文的研究内容,旨在训练一种转换质量有一定保证的前提下尽量提高其转换速度的风格转换模型,并将其直接封装在app中,制作这样一款方便在手机端进行风格转换的应用。
1.2 基于深度学习的风格转换研究现状
1.2.1 卷积现状
自2010年起,每年举办的ImageNet ILSVRC(Large Scale Visual Recognition Challenge)是国际知名的图像分类大赛,该比赛采用包含多达上百万张图像的数据集作为比赛的数据集,这些图片被分成1000多个类别。在大赛举办的前两年,在比赛中夺得桂冠的选手采用的是传统图像分类算法。2012年是一个分水岭,此后的夺冠选手团队均采用基于卷积神经网络的模型来进行对数据集图像的分类工作,而且效果拔群。可以说ImageNet大赛对卷积神经网络近些年的发展起到了至关重要的推动作用,参赛选手为了得到更好的分类效果不断对之前的卷积网络进行提升,诞生了多个知名的用于图像领域的卷积神经网络例如Alex Net和Google Net等。
1.2.2 风格迁移现状
2015年是风格迁移技术发展的分水岭,严格意义上可以说在此之后,图像风格进入到新的阶段——基于深度学习的图像风格迁移。在将神经网络用于研究风格迁移之前,图像迁移研究方法的框架是[1]:首先人工分析图像,然后建立数学和统计模型,本质上是数学建模和模型应用的问题。这一过程非常费时费力,并且由于不同图像的研究模型不同,导致模型几乎不能复用研究,人工和时间成本被进一步加大。
在2015年,Gatys发表了两篇关于图像风格迁移的文章,文章中他创新性的将深度学习应用于图像风格迁移工作中。第一篇论文的创新性在于纹理算法[15]:在文章中,他展示了使用VGG-19来提取图像的特征值,并用深度学习网络来进行纹理建模。自从以后,图像迁移不在需要人工建模。有一点值得提的是,图像风格不能完全等同于纹理,还需要对内容图片的内容进行提前,同时不包含它的风格。在第二篇文章中[11],为了解决之前留下来针对图片内容提取的问题,Gatys提出使用预训练的物体目标检测模型俩对图片的内容进行识别和抓取。之后,内容特征和纹理特征的结合用到了Deep Dream算法。
请支付后下载全文,论文总字数:19156字