实用语音识别基础--21世纪高等院校技术优秀教材ISBN:711803746作者:王炳锡屈丹彭煊出版社:国防工业出版社本书从语音识别的基本理论出发,以“从理论到实用”为主线,讲解了国际上最新、最前沿的语音识别领域的关键技术,从语料库建立、语音信号预处理、特征提取、特征变换、模型建立等方面详细介绍了语音识别系统建立的过程,并针对语音识别系统实用化的问题,给出了一些改善语音识别系统性能的关键技术,力求语音识别能走出实验室,向实用发展。
全书共分四个部分(17章),第一部分介绍语音识别的基本理论;
第二部分介绍实用语音识别系统建立的过程;
第三部分列举了语音识别系统工程化所需的关键技术;
第四部分对语音识别的4个主要应用领域进行了详尽的、深入浅出的讲解,并根据最新的研究与实验结果提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与实用性。
章节之间紧密配合、前后呼应,具有很强酶系统性。
同时,通过书中的研究过程和研究方法,读者能够在以后的研究工作中得到很大的启发。
本书可作为高等院校理工科通信和信息处理及相关专业的高年级本科生和(硕士、博士)研究生的教材或参考书,也可供从事信息处理、通信工程等专业的研究人员参考。
目录: 第1章绪论 1.1概述 1.2语音识别综述 1.3国内外语音识别的研究现状和发展趋势 参考文献 第一部分基本理论 第2章听觉机理和汉语语音基础 2.1概述 2.2听觉机理和心理 2.2.1语音听觉器官的生理结构 2.2.2语音听觉的心理 2.3发音的生理机构与过程 2.4汉语语音基本特性 2.4.1元音和辅音 2.4.2声母和韵母 2.4.3音调字调 2.4.4音节字构成 2.4.5汉语的波形特征 2.4.6音的频谱特性 2.4.7辅音的频谱特性 2.4.8汉语语音的韵律特征 2.5小结 参考文献 第3章语音信号处理方法--时域处理 3.1概述 3.2语音信号的数字化和预处理 3.2.1语音信号的数字化 3.2.2语音信号的预处理 3.3短时平均能量和短时平均幅度 3.3.1短时平均能量 3.3.2短时平均幅度 3.4短时过零分析 3.4.1短时平均过零率 3.4.2短时上升过零间隔 3.5短时自相关函数和平均幅度差函数 3.5.1短时自相关函数 3.5.2短时平均幅度差函数 3.6高阶统计量 3.6.1单个随机变量情况 3.6.2多个随机变量及随机过程情况 3.6.3高斯过程的高阶累积量 3.7小结 参考文献 第4章语音信号处理方法--时频处理 4.1概述 4.2短时傅里叶变换 4.2.1短时傅里叶变换的定义和物理意义 4.2.2基于短时傅里叶变换的语谱图及其时频分辨率 4.2.3短时傅里叶谱的采样 4.3小波变换 4.3.1连续小波变换 4.3.2二进小波变换 4.3.3离散小波变换 4.3.4多分辨分析 4.3.5正交小波包 4.4Wigner分布 4.4.1Wigner分布的定义 4.4.2Wigner分布的一般性质 4.4.3两个信号和妁Wigner分布 4.4.4Wigner分布的重建 4.4.5Wigner分布的实现 4.5小结 参考文献 第5章语音信号处理方法--倒谱同态处理 5.1概述 5.2复倒谱和倒谱 5.2.1定义 5.2.2复倒谱的性质 5.3语音信号的倒谱分析与同态解卷积 5.3.1叠加原理和广义叠加原理 5.3.2同态解卷特征系统和同态解卷反特征系统 5.3.3同态解卷系统 5.3.4语音的复倒谱及同态解卷 5.4避免相位卷绕的算法 5.4.1最小相位信号法 5.4.2递归法
2025/2/21 15:39:21
11.75MB
语音识别
1