实用语音识别基础--21世纪高等院校技术优秀教材ISBN:711803746作者:王炳锡屈丹彭煊出版社:国防工业出版社本书从语音识别的基本理论出发,以“从理论到实用”为主线,讲解了国际上最新、最前沿的语音识别领域的关键技术,从语料库建立、语音信号预处理、特征提取、特征变换、模型建立等方面详细介绍了语音识别系统建立的过程,并针对语音识别系统实用化的问题,给出了一些改善语音识别系统性能的关键技术,力求语音识别能走出实验室,向实用发展。
  全书共分四个部分(17章),第一部分介绍语音识别的基本理论;
第二部分介绍实用语音识别系统建立的过程;
第三部分列举了语音识别系统工程化所需的关键技术;
第四部分对语音识别的4个主要应用领域进行了详尽的、深入浅出的讲解,并根据最新的研究与实验结果提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与实用性。
章节之间紧密配合、前后呼应,具有很强酶系统性。
同时,通过书中的研究过程和研究方法,读者能够在以后的研究工作中得到很大的启发。
  本书可作为高等院校理工科通信和信息处理及相关专业的高年级本科生和(硕士、博士)研究生的教材或参考书,也可供从事信息处理、通信工程等专业的研究人员参考。
  目录:  第1章绪论  1.1概述  1.2语音识别综述  1.3国内外语音识别的研究现状和发展趋势  参考文献  第一部分基本理论  第2章听觉机理和汉语语音基础  2.1概述  2.2听觉机理和心理  2.2.1语音听觉器官的生理结构  2.2.2语音听觉的心理  2.3发音的生理机构与过程  2.4汉语语音基本特性  2.4.1元音和辅音  2.4.2声母和韵母  2.4.3音调字调  2.4.4音节字构成  2.4.5汉语的波形特征  2.4.6音的频谱特性  2.4.7辅音的频谱特性  2.4.8汉语语音的韵律特征  2.5小结  参考文献  第3章语音信号处理方法--时域处理  3.1概述  3.2语音信号的数字化和预处理  3.2.1语音信号的数字化  3.2.2语音信号的预处理  3.3短时平均能量和短时平均幅度  3.3.1短时平均能量  3.3.2短时平均幅度  3.4短时过零分析  3.4.1短时平均过零率  3.4.2短时上升过零间隔  3.5短时自相关函数和平均幅度差函数  3.5.1短时自相关函数  3.5.2短时平均幅度差函数  3.6高阶统计量  3.6.1单个随机变量情况  3.6.2多个随机变量及随机过程情况  3.6.3高斯过程的高阶累积量  3.7小结  参考文献  第4章语音信号处理方法--时频处理  4.1概述  4.2短时傅里叶变换  4.2.1短时傅里叶变换的定义和物理意义  4.2.2基于短时傅里叶变换的语谱图及其时频分辨率  4.2.3短时傅里叶谱的采样  4.3小波变换  4.3.1连续小波变换  4.3.2二进小波变换  4.3.3离散小波变换  4.3.4多分辨分析  4.3.5正交小波包  4.4Wigner分布  4.4.1Wigner分布的定义  4.4.2Wigner分布的一般性质  4.4.3两个信号和妁Wigner分布  4.4.4Wigner分布的重建  4.4.5Wigner分布的实现  4.5小结  参考文献  第5章语音信号处理方法--倒谱同态处理  5.1概述  5.2复倒谱和倒谱  5.2.1定义  5.2.2复倒谱的性质  5.3语音信号的倒谱分析与同态解卷积  5.3.1叠加原理和广义叠加原理  5.3.2同态解卷特征系统和同态解卷反特征系统  5.3.3同态解卷系统  5.3.4语音的复倒谱及同态解卷  5.4避免相位卷绕的算法  5.4.1最小相位信号法  5.4.2递归法
2025/2/21 15:39:21 11.75MB 语音识别
1
语音中准确的情绪识别对于智能医疗、智能娱乐和其他智能服务等应用程序非常重要。
由于汉语语言的复杂性,汉语语音的高精度动作识别具有挑战性。
本文探讨了如何提高语音情感识别的准确性,包括语音信号特征提取和情感分类方法。
从语音样本中提取五种特征:梅尔频率倒谱系数(mfcc)、音调、共振峰、短期过零率和短期能量
2025/1/15 18:56:50 31KB 语音识别
1
数字音频水印算法大全倒谱音频水印算法复倒谱水印算法基于能量比的小波域音频水印算法基于小波与复倒谱变换的音频数字水印算法面向公共信息传播的音频水印算法音频特征提取方法
2024/12/24 8:26:31 3.16MB 音频 水印算法
1
matlab实现对语音的处理,包括录制语言,频率波形绘制,倒谱复倒谱等
2024/12/20 3:43:09 909KB matlab
1
目的:使用CNN卷积神经网络实现语音识别步骤:(1)预处理。
首尾端的静音切除,降低对后续步骤造成的干扰,然后进行声音分帧,把声音切开成帧,,各帧之间一般是有交叠。
(2)特征提取。
运用的算法为倒谱系数(MFCC),把每一帧波形变成一个包含声音信息的多维向量;
(3)RNN模型训练。
有了特征,就可以使用TensorFlow完成模型的建立和训练了。
(4)验证模型。
目标:对相应的声音数据进行分类,例如数据的是数数的数据,能够输出对应的数字。
2024/9/7 10:11:28 5KB cnn 语音识别
1
基于倒谱特性的带噪语音端点检测,用倒谱距离代替短时能量为判决门限,改进了HNN语音检测来适应噪声变化
2024/6/23 15:27:58 672KB 端点检测 倒谱
1
关于双谱,三谱,和倒谱的一些文献与代码,并上传了一些高阶谱切片的快速算法
2024/3/15 6:47:22 19.58MB 双谱 三谱 倒谱
1
通过美尔频率倒谱系数加奇异值分解的方法提出出来的音频信号的感知哈希值.编程环境是matlab。
其中包含了MFCC函数,分帧函数,梅尔滤波器组函数等。
2024/3/7 8:21:36 2KB 感知哈希,SVD MFCC
1
matlab录音与音频处理GUI界面包括录音,求频谱,语谱,倒谱。


2024/2/5 9:49:08 437KB matlab GUI 语音处理 暴风一号
1
MATLAB倒谱程序
2024/1/10 20:55:26 523B 倒谱
1
共 19 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡