实用语音识别基础--21世纪高等院校技术优秀教材ISBN:711803746作者:王炳锡屈丹彭煊出版社:国防工业出版社本书从语音识别的基本理论出发,以“从理论到实用”为主线,讲解了国际上最新、最前沿的语音识别领域的关键技术,从语料库建立、语音信号预处理、特征提取、特征变换、模型建立等方面详细介绍了语音识别系统建立的过程,并针对语音识别系统实用化的问题,给出了一些改善语音识别系统性能的关键技术,力求语音识别能走出实验室,向实用发展。
  全书共分四个部分(17章),第一部分介绍语音识别的基本理论;
第二部分介绍实用语音识别系统建立的过程;
第三部分列举了语音识别系统工程化所需的关键技术;
第四部分对语音识别的4个主要应用领域进行了详尽的、深入浅出的讲解,并根据最新的研究与实验结果提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与实用性。
章节之间紧密配合、前后呼应,具有很强酶系统性。
同时,通过书中的研究过程和研究方法,读者能够在以后的研究工作中得到很大的启发。
  本书可作为高等院校理工科通信和信息处理及相关专业的高年级本科生和(硕士、博士)研究生的教材或参考书,也可供从事信息处理、通信工程等专业的研究人员参考。
  目录:  第1章绪论  1.1概述  1.2语音识别综述  1.3国内外语音识别的研究现状和发展趋势  参考文献  第一部分基本理论  第2章听觉机理和汉语语音基础  2.1概述  2.2听觉机理和心理  2.2.1语音听觉器官的生理结构  2.2.2语音听觉的心理  2.3发音的生理机构与过程  2.4汉语语音基本特性  2.4.1元音和辅音  2.4.2声母和韵母  2.4.3音调字调  2.4.4音节字构成  2.4.5汉语的波形特征  2.4.6音的频谱特性  2.4.7辅音的频谱特性  2.4.8汉语语音的韵律特征  2.5小结  参考文献  第3章语音信号处理方法--时域处理  3.1概述  3.2语音信号的数字化和预处理  3.2.1语音信号的数字化  3.2.2语音信号的预处理  3.3短时平均能量和短时平均幅度  3.3.1短时平均能量  3.3.2短时平均幅度  3.4短时过零分析  3.4.1短时平均过零率  3.4.2短时上升过零间隔  3.5短时自相关函数和平均幅度差函数  3.5.1短时自相关函数  3.5.2短时平均幅度差函数  3.6高阶统计量  3.6.1单个随机变量情况  3.6.2多个随机变量及随机过程情况  3.6.3高斯过程的高阶累积量  3.7小结  参考文献  第4章语音信号处理方法--时频处理  4.1概述  4.2短时傅里叶变换  4.2.1短时傅里叶变换的定义和物理意义  4.2.2基于短时傅里叶变换的语谱图及其时频分辨率  4.2.3短时傅里叶谱的采样  4.3小波变换  4.3.1连续小波变换  4.3.2二进小波变换  4.3.3离散小波变换  4.3.4多分辨分析  4.3.5正交小波包  4.4Wigner分布  4.4.1Wigner分布的定义  4.4.2Wigner分布的一般性质  4.4.3两个信号和妁Wigner分布  4.4.4Wigner分布的重建  4.4.5Wigner分布的实现  4.5小结  参考文献  第5章语音信号处理方法--倒谱同态处理  5.1概述  5.2复倒谱和倒谱  5.2.1定义  5.2.2复倒谱的性质  5.3语音信号的倒谱分析与同态解卷积  5.3.1叠加原理和广义叠加原理  5.3.2同态解卷特征系统和同态解卷反特征系统  5.3.3同态解卷系统  5.3.4语音的复倒谱及同态解卷  5.4避免相位卷绕的算法  5.4.1最小相位信号法  5.4.2递归法
2025/2/21 15:39:21 11.75MB 语音识别
1
基于GABOR的特征提取可以直接运行内附有说明简单易懂
2025/2/2 6:43:47 61KB GABOR特征
1
结合高光谱数据和深度学习的特点,提出一种同时考虑像素光谱信息和空间信息的深度卷积神经网络框架。
该框架主要步骤如下:首先利用主成分分析法对高光谱遥感图像进行光谱特征提取,消除特征之间的相关性,并降低特征维数,获得清晰的空间结构;
然后利用深度卷积神经网络对输入的样本进行空间特征提取;
最后通过学习到的高级特征进行回归训练
2025/1/22 10:55:54 3.25MB 深度学习 高光谱图像 分类
1
matlab实现的阶次分析算法,用于变转速机械故障特征提取,可运行,包含寻找脉冲时刻,等角度时刻,数字跟踪滤波,样条差值等步骤
1
小波变换的特征提取,里面包含了主要的程序代码,可直接拿来使用,请大家自行下载。
希望大家都能学好。
2025/1/16 16:57:09 903B 小波变换
1
语音中准确的情绪识别对于智能医疗、智能娱乐和其他智能服务等应用程序非常重要。
由于汉语语言的复杂性,汉语语音的高精度动作识别具有挑战性。
本文探讨了如何提高语音情感识别的准确性,包括语音信号特征提取和情感分类方法。
从语音样本中提取五种特征:梅尔频率倒谱系数(mfcc)、音调、共振峰、短期过零率和短期能量
2025/1/15 18:56:50 31KB 语音识别
1
用椭圆拟合轮廓,并求长短轴比,主要应用于模式识别中的特征提取
2025/1/15 10:50:54 1KB opencv 椭圆 长短轴
1
数字摄影测量,基于相关系数的影像匹配,和特征提取代码一起打包
2025/1/11 20:47:03 37.29MB 特征点提取 随机分布 均匀分布
1
基于MatlabGUI平台,实现了一个用DTW来完成语音识别的演示系统。
语音支持现场录制。
特征提取的是MFCC
1
利用snake算法实现数字图像的边缘检测,图像分割以及特征提取,已经实现过了!
1
共 316 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡