基于文本描述的图像生成研究开题报告
2020-02-18 18:26:45
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
随着人类社会的发展,与信息网络等相关的技术和研究取得了很大的进展。在所谓的大数据时代,每个人时时刻刻都在产生信息,为了有效利用这些信息便利人们生活,所以对于信息的处理尤为重要。就拿其中某一个方面来说,摄像功能丰富了图像资源,随之也就出现了大量关于图像的处理手段,例如图像分类和图像检索等,但是只通过图像提取文字标签却满足不了现实的需要,所以反过来通过文字的描述来生成图片成为了研究重点。
在先前的认知当中,图像的隐含意义都是通过文字来表明,而文字向来是传播信息的载体,由于图像的视觉阅读逐渐在生活增加,人们所认同的文字信息逐步转向图像信息,现如今有各种各样的读图形式,图像也变成了信息传递的可靠来源。文字本身就带有图像感,因此图像本身也就可承担信息。当今时代,人们的生活节奏不断加快,阅读获取信息的方式也要依据时间来定,而通过视听来传播信息是最为便捷的方式。
2. 研究的基本内容与方案
为实现利用文本描述来生成对应图像,本课题致力于研究一种基于gan网络从文本描述生成图像的方法。提取文字特征用来学习一个文本的特征表示,利用这些特征得到一个比较真实的图像。在深入研究对抗生成网络的基本原理基础上,拟实现一个基于python的仿真过程,首先提取文字描述特征,能够根据文本特征生成图片,再判断生成的图片的真假以及其是否符合描述,从而实现针对文本描述合成真假难辨的图像的目标。
生成式对抗网络有生成器网络和判别器网络两个神经网络构成,如图2.1所示gan模型结构,其中生成器根据输入的文本描述试图产生欺骗判别器的真实样本,判别器则用来区分真实样本和生成样本。在这种对抗博弈下使得生成器和判别器的性能不断提高,当达到纳什平衡后,生成器网络可以生成以假乱真的输出。两个神经网络都执行以文本特征为条件的前馈推断,gan的判别网络需要判断生成的图像合理与否且判断生成的图像是否与对应的文本相匹配。
3. 研究计划与安排
第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。
第7-9周:实现文本特征的提取。
4. 参考文献(12篇以上)
[1] 马龙龙,韩先培,孙乐.图像的文本描述方法研究综述[j].中文信息学报,2018,32(04):1-12.
[2] 王坤峰,苟超,段艳杰,等.生成式对抗网络gan的研究进展与展望[j].自动化学报,2017,43(3):321-332.