实用语音识别基础--21世纪高等院校技术优秀教材ISBN:711803746作者:王炳锡屈丹彭煊出版社:国防工业出版社本书从语音识别的基本理论出发,以“从理论到实用”为主线,讲解了国际上最新、最前沿的语音识别领域的关键技术,从语料库建立、语音信号预处理、特征提取、特征变换、模型建立等方面详细介绍了语音识别系统建立的过程,并针对语音识别系统实用化的问题,给出了一些改善语音识别系统性能的关键技术,力求语音识别能走出实验室,向实用发展。
  全书共分四个部分(17章),第一部分介绍语音识别的基本理论;
第二部分介绍实用语音识别系统建立的过程;
第三部分列举了语音识别系统工程化所需的关键技术;
第四部分对语音识别的4个主要应用领域进行了详尽的、深入浅出的讲解,并根据最新的研究与实验结果提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与实用性。
章节之间紧密配合、前后呼应,具有很强酶系统性。
同时,通过书中的研究过程和研究方法,读者能够在以后的研究工作中得到很大的启发。
  本书可作为高等院校理工科通信和信息处理及相关专业的高年级本科生和(硕士、博士)研究生的教材或参考书,也可供从事信息处理、通信工程等专业的研究人员参考。
  目录:  第1章绪论  1.1概述  1.2语音识别综述  1.3国内外语音识别的研究现状和发展趋势  参考文献  第一部分基本理论  第2章听觉机理和汉语语音基础  2.1概述  2.2听觉机理和心理  2.2.1语音听觉器官的生理结构  2.2.2语音听觉的心理  2.3发音的生理机构与过程  2.4汉语语音基本特性  2.4.1元音和辅音  2.4.2声母和韵母  2.4.3音调字调  2.4.4音节字构成  2.4.5汉语的波形特征  2.4.6音的频谱特性  2.4.7辅音的频谱特性  2.4.8汉语语音的韵律特征  2.5小结  参考文献  第3章语音信号处理方法--时域处理  3.1概述  3.2语音信号的数字化和预处理  3.2.1语音信号的数字化  3.2.2语音信号的预处理  3.3短时平均能量和短时平均幅度  3.3.1短时平均能量  3.3.2短时平均幅度  3.4短时过零分析  3.4.1短时平均过零率  3.4.2短时上升过零间隔  3.5短时自相关函数和平均幅度差函数  3.5.1短时自相关函数  3.5.2短时平均幅度差函数  3.6高阶统计量  3.6.1单个随机变量情况  3.6.2多个随机变量及随机过程情况  3.6.3高斯过程的高阶累积量  3.7小结  参考文献  第4章语音信号处理方法--时频处理  4.1概述  4.2短时傅里叶变换  4.2.1短时傅里叶变换的定义和物理意义  4.2.2基于短时傅里叶变换的语谱图及其时频分辨率  4.2.3短时傅里叶谱的采样  4.3小波变换  4.3.1连续小波变换  4.3.2二进小波变换  4.3.3离散小波变换  4.3.4多分辨分析  4.3.5正交小波包  4.4Wigner分布  4.4.1Wigner分布的定义  4.4.2Wigner分布的一般性质  4.4.3两个信号和妁Wigner分布  4.4.4Wigner分布的重建  4.4.5Wigner分布的实现  4.5小结  参考文献  第5章语音信号处理方法--倒谱同态处理  5.1概述  5.2复倒谱和倒谱  5.2.1定义  5.2.2复倒谱的性质  5.3语音信号的倒谱分析与同态解卷积  5.3.1叠加原理和广义叠加原理  5.3.2同态解卷特征系统和同态解卷反特征系统  5.3.3同态解卷系统  5.3.4语音的复倒谱及同态解卷  5.4避免相位卷绕的算法  5.4.1最小相位信号法  5.4.2递归法
2025/2/21 15:39:21 11.75MB 语音识别
1
https://download.csdn.net/download/qq_41739364/86339152
2025/2/20 2:46:17 2.08MB python
1
该文件中包含了Adaptiveas-natural-as-possibleimagestitching论文以及As-Projective-As-PossibleImageStitchingwithMovingDLT这两种较为经典的图像拼接方法。
具体包含了ransac算法、multi-GSsampling算法、求取单应性矩阵Homography的奇异矩阵算法、相似矩阵变换的求取、图像翘曲、局部单应性矩阵权重占比、图像融合等算法。
具体过程为:1.利用sift算法提取特征点2.利用ransacmulti-gs算法求取单应性矩阵H3.利用movingDLT求取referenceimage的翘曲4.利用提到的线性单应性矩阵H_linear求取网格化后的局部单应性矩阵5.图像融合及拼接
2025/1/29 22:13:31 10KB AANAP APAP 图像拼接
1
使用SOM算法+CNN提取特征,对图像进行聚类。
运行环境,python3.6+tensorflow1.11.0
2024/10/26 21:16:08 105.62MB som
1
基于Gabor+PCA+SVM的性别识别.图像预处理。
从人脸数据库提取人脸。
为提取特征做准备
2024/10/4 0:09:19 12.6MB Gabor PCA 性别识别
1
基于SVM+HOG的人脸检测matlab程序。
内含libsvm-3.22SVM库。
资源中tgrs2013_epfifr.rar可不需要解压,可以无视。
该程序自动读取人脸库文件夹下不同人物的照片,可实现遍历文件夹及子文件夹下包含的图片,进而提取特征利用SVM训练分类识别。
这可以作为一个baseline,基础框架,在这个基础上可以提取更多特征进而提高识别精度。
由于人脸库是我们自己构造的,涉及了个人隐私,不能共享,所以本程序中人脸库文件下图像需要自己提供哦,然后自己构造相应的训练样本便可以运行了。
1
先把信号进行lmd分解,在通过方差贡献率选择IMF分量,在计算能量熵。
你值得拥有,可以运行,求好评!
2024/9/11 8:37:58 1.23MB matlab
1
静脉识别,生物识别的一种。
静脉识别系统一种方式是通过静脉识别仪取得个人静脉分布图,依据专用比对算法从静脉分布图提取特征值,另一种方式通过红外线CCD摄像头获取手指、手掌、手背静脉的图像,将静脉的数字图像存贮在计算机系统中,实现特征值存储。
静脉比对时,实时采取静脉图,运用先进的滤波、图像二值化、细化手段对数字图像提取特征,采用复杂的匹配算法同存储在主机中静脉特征值比对匹配,从而对个人进行身份鉴定,确认身份。
2024/9/3 5:18:33 405KB 静脉识别 matlab 图像处理
1
分析了LogGabor滤波器的性能,详述了用于指纹识别的LogGabor滤波器的构造方法,在此基础上提出了基于LogGabor滤波器的指纹纹理匹配算法。
首先采用了一种快速有效的参考点定位方法,在确定有效区域并归一化后,通过傅里叶变换把指纹图像转换到频域,在频域进行logGabor滤波,最后在滤波图像中提取特征,并与传统方法作了比较。
实验结果表明,所提出算法的性能优于基于Gabor滤波的纹理匹配方法和基于细节点的方法,提高了指纹识别的准确率。
2024/8/30 8:06:55 373KB Log Gabor
1
乳腺癌病理图像的自动分类具有重要的临床应用价值。
基于人工提取特征的分类算法,存在需要专业领域知识、耗时费力、提取高质量特征困难等问题。
为此,采用一种改进的深度卷积神经网络模型,实现了乳腺癌病理图像的自动分类;同时,利用数据增强和迁移学习方法,有效避免了深度学习模型受样本量限制时易出现的过拟合问题。
实验结果表明,该方法的识别率可达到91%,且具有较好的鲁棒性和泛化性
2024/8/3 5:11:41 632KB 深度学习 图像识别
1
共 38 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡