基于语音的移动用户情感识别技术研究开题报告
2021-12-18 21:41:40
全文总字数:3492字
1. 研究目的与意义及国内外研究现状
对我们大部分人来说,每天心情有点变化是很正常的。甚至有时候,一天时间内喜怒哀乐随机出现,自己都可以调整,不至于走向极端。但是对一类人来说,比如重度抑郁症或狂躁症患者,情绪的剧烈变化可能会导致他们走向极端。另一方面,如今社会快速的生活和工作节奏,给许多人带来了极大的压力。如何实时监测这些人的情绪是一个非常复杂的问题。那么有没有一种比较简单又可行的方法来识别一个人的心情变化呢?本项目借助于人们日常使用频繁的手机,研究一种基于语音识别的用户情感检测和识别技术,通过分析语音波形里的音调、音量和节奏等特征,在情绪真正开始波动之前,预测情绪的变化。
随着计算机技术的迅速发展,除了人与人交流外,人机交流也变得越来越普遍,人机交互系统的快速发展,使语音信号中的情感信息越来越受到人们的重视,特别是在语音合成和语音识别领域。语音信号不仅传达文字符号信息还包含了说话人的情感信息,因此在人机交互中计算机要能更加主动地适应操作者的需要,首先要能够识别说话者的情感,即进行情感识别。
语音信号中的情感信息是重要的信息资源,它是人们感知事物必不可少的部分,例如,同样一句话,由于说话人所表现的情感不同,在听者的感知上就会有较大的差别,所谓“听话听音”就是这个道理。然而,传统的语音信号处理技术把这部分信息作为模式的变动和差异噪声,并通过规则化处理给去掉了。实际上,人们同时接受各种形式的信息,怎样有效地利用各种形式的信息以达到最佳的信息传递和交流效果,是今后信息处理研究的发展方向。因此,语音情感信息的研究,即分析语音中的情感特征,判断说话人的喜怒哀乐是一个具有重大意义的研究课题。
2. 研究的基本内容
语音情感识别通过检测声学特征参数的变化判断说话人情绪的起伏。情感合成则是通过调节中性发音的声学特征值得到含某种情绪的语句发音。情感处理目前涉及的声学特征仍是语音处理中常用的几类特征,包括基音周期、共振峰频率、共振峰频带、lpcc、mfcc及这些参数的衍生参数。本文主要研究以下内容:
(1)分析正常状态下人的语音波形特征;
(2)分析高兴状态下人的语音波形特征;
3. 实施方案、进度安排及预期效果
(1)实行方案
本文主要研究语音信号中的情感特征的提取和识别。首先通过查阅资料熟悉语音情感识别相关的情感理论基础、语音情感库、语音情感识别的国内外现状;其次对语音信号处理的几个重要问题进行了研究,包括语音情感识别系统、语音信号的产生机理、语音信号的数字化、预处理和端点检测问题;然后对比不同情感类型的时域波形,分析语音情感特征的特点和提取方法,包括基音周期特征、共振峰特征、线性预测倒谱系数lpcc和mel频率倒谱系数,最后建立语音识别模型,判断输入一段语音的情感状态。
(2)进度安排
4. 参考文献
[1] 赵力, 蒋春辉, 邹采荣, 吴镇扬. 语音信号中的情感特征分析和识别的研究[j]. 电子学报, 2004,32(4): 606-609.
[2] 许小颖, 陶建华. 汉语情感系统中情感划分的研究[a]. 第一届中国情感计算及智能交互学术会议[c]. 北京, 2003: 199-205.
[3] 张雪英. 数字语音处理及matlab仿真[m], 北京: 电子工业出版社, 2010.