嵌入式语音识别系统的设计与实现毕业论文

2021-06-24 22:15:47

摘要

社会的不断发展使得人们对智能语音产品的需求越来越强烈，语音识别技术的飞速发展满足了这一需求，语音实用化产品随之大量涌现。本文介绍了一种以ARM 为核心的嵌入式语音识别系统的设计与实现。该系统选用ST公司的基于ARM Cortex—M3内核的32位处理器STM32F103RCT6作为核心处理单元，通过以LD3320芯片为核心的硬件单元实现多功能语音识别功能，并且在系统中实现SD卡文件系统，可在不更改单片机源程序的前提下，达到动态编辑识别列表关键词之效。经过大量实践证明该设计适合嵌入式组件开发中需要灵活更改识别内容和返回参数的应用，设计具有高性价比、交互简易、识别率高、功能多样、扩展性强等特点，便于嵌入式应用。

关键词：语音识别；声音控制；stm32；LD3320

Abstract

With the continuous development of computing technology, people’s demand for voice intelligent product becomes more and more intense, it not only promotes the development of speech recognition technology, voice and prompts the plethora of practical products. This paper introduces a kind of ARM as the core of the design and implementation of embedded speech recognition system. Module’s core of the processing unit with ST company is based on ARM architecture - M3 32-bit processor STM32F103RCT6 kernel. This module by LD3320 chip as the core of the hardware unit multifunctional speech recognition, realizes SD Calvin system in the system, reaches dynamic editing to identify a list of keywords under the premise of not changing the single chip microcomputer in the source program. After a lot of practice proved that the design is suitable for embedded component development needed to flexibly change the application content and return parameter identification. Design is cost-effective, simple interaction, high recognition rate, functional diversity, strong expansibility, etc,and it is convenient to be used in the embedded.

Key Words: speech recognition；voice control；LD3320；stm32

第1章绪论 1

1.1研究背景、目的 1

1.2相关领域国内外研究现状 1

1.3本文研究的主要内容和结构组织 2

第2章非特定人语音识别技术原理 4

2.1 语音识别的类型 4

2.2 语音识别系统的基本结构 4

2.2.1预处理 4

2.2.2端点检测 5

2.2.3特征参数提取 5

2.3语音识别技术简介 6

2.3.1 LD3320语音识别芯片的工作原理 6

2.3.2非特定人（Speaker Independent ASR）语音识别技术简介 7

2.4 本章小结 8

第3章嵌入式系统硬件功能的设计与实现 9

3.1 语音识别系统硬件整体架构 9

3.2主控制模块 9

3.3存储扩展模块 10

3.4语音识别模块 12

3.5 音频编解码模块 12

3.6 显示模块 14

3.7 本章小结 15

第4章嵌入式语音识别系统的软件设计 16

4.1　语音识别程序的设计 16

4.2音频播放模块程序设计 16

4.3 SD卡程序 17

4.4 字符显示程序 20

4.5 主函数模程序 22

4.6 本章小结 23

第5章性能测试与应用 24

5.1 性能测试 24

5.2 本章小结 26

第6章总结与展望 27

6.1全文工作总结 27

6.2下一步工作展望 27

参考文献 28

附录A 部分主要程序 29

致谢 34

第1章绪论

1.1研究背景、目的

现代科学和计算机技术的发展促使人们需要一种更加自然的方式与机器进行信息交流。人类最方便、最常用的信息交流形式当属说话交流，这就很容易让人想到能否用说话方式代替传统的人机交流方式诸如键盘、鼠标等方式。然而这需要让计算机听懂人说话，这就产生了语音识别技术。

语音识别，即自动语音识别（ASR（Automatic Speech Recognition））的简称。简单地说，语音识别就是让机器能够准确无误地明白人在说什么，并能根据信息做出相应的动作或回应。语音识别技术的发展让这一想法逐渐得以成为现实。

语音识别技术是由计算机技术、信号处理技术和模式识别技术的发展而来的。语音识别产品应用广泛，在语音拨号系统、英汉翻译系统、智能玩具控制、智能家居系统、智能手机、股票交易系统、银行服务系统、医疗智能服务、汽车智能导航、工业控制等领域都能见到它的身影。

根据核心处理部分不同，语音识别系统主要分为基于PC机的语音识别系统和嵌入式语音识别系统。嵌入式语音识别系统由于具有耗电省、体积小、价格低、可靠性高等众多优点，成为了当今语音识别系统发展的重要趋势，其实用产品越来越多地出现在市场上。目前，嵌入式语音识别系统的主要应用方式是语音命令控制，原本的手工操作就由语音命令控制代替了。通过语音识别技术的发展趋势可以预测，未来十年内以专用语音芯片为核心的嵌入式语音识别系统应用会更加普遍、发展会更加迅速，嵌入式语音智能实用产品会大量的随之出现。

基于此背景,本文根据人们现实生活的需要,在对语音识别技术进行基本了解的基础上, 实现了一个非特定人嵌入式语音识别系统，并加入了关键词动态编辑功能，将其应用于人们的日常生活当中,以方便人们的日常生活、提高人们的生活质量。

1.2相关领域国内外研究现状

上个世纪30年代，语音识别技术开始萌芽。1952年，美国贝尔实验室的戴维斯（Davis）等人成功研制出的第一个可以识别9 个英文数字的比较完善的语音识别系统——Audry系统——标志着语音识别研究的开始。1960年，德纳（Denes）和马修（Mathew)开启了一个新时代，他们把数字计算机（Digital Computer）引进语音识别中，从此计算机成为了语音处理的核心，模拟电路随之被替代。20世纪70年代，语音识别又取得了飞跃性进展。线性预测编码（Linear Predictive Coding，LPC）技术的提出为语音特征参数提取提供了一种依据。20世纪80年代初，语音识别研究进入更深一步的发展，加里（Gary）和马克尔（Markel）等人在前人研究的基础上提出了矢量量化（Vector Quantization，VQ）技术——一种数据压缩算法。到了20世纪90年代，国外许多研究机构都已经研制出大词汇量的识别系统。进入21世纪，微软、Google、苹果公司、IBM公司等许多企业抓住商机，开发了语音智能产品，随之语音识别技术开始大量转化为实用商品进入市场。2011年10月，苹果公司在智能手机里嵌入了语音控制系统Siri，推出了iPhone 4S，这是一次革命性的变化，它使人与手机之间的互动操作更加简单、智能^[1]。

我国语音识别技术起步于五十年代，现有后来居上之势。中国科学院声学所是这一技术的先行者。1958年，中国科学院声学所应用电子管组成的电路成功地识别了9个左右的元音，1973年又将计算机技术引入语音识别中，开启了新的研究时代。1984年，清华大学成功研制出一个大概可以识别1000个词语左右的大词汇量的汉语语音识别系统。从1986年开始，国家863计划开始实施，国家智能计算机专家组为语音识别技术研究专门立项，每两年滚动一次，语音识别技术发展开始进入快车道。1990年，清华大学研制成功了非特定人中字表和大字表的语音识别系统。2008年，安徽科大讯飞率先对外推出了轻量级智能语音识别系统Aitalk2.0。该系统功能强大，应用范围广，可以实现语音拨号、语音操控、语音查找、语音搜索等智能控制功能，可应用于手机、车载导航等嵌入式设备中。到了2012年3月，长虹Ciri语音新智能电视问世，它拥有领先世界的中文语音识别技术，并且采用了人性化语音操控设计，终结了国内电视产业的普通智能时代。现在，我国语音识别技术的研究水平在国际上已经追赶上了发达国家，并且在汉语语音识别方面上有自己的优势与特点。

1.3本文研究的主要内容和结构组织

本文主要是应用非特定人的语音识别系统的研究成果进行开发设计，设计出的系统具有可移植性，比如可以移植于智能玩具、智能家居中实现语音控制功能等，具有很的强实用性。本文研究的主要内容是：应用嵌入式技术，设计一个有多用途的和可移植的嵌入式语音识别系统，实现语音控制外设、汉字显示、人机对话、MP3播放等功能。本系统采用ARM Cortex—M3内核、ST公司的32位芯片STM32F103RCT6，构建SD卡文件系统，结合LD3320语音识别芯片实现非特定人语音识别关键词动态编辑功能，适用于嵌入式语音识别场合。

您需要先支付 50元 才能查看全部内容！立即支付

注册

找回密码