实用语音识别基础--21世纪高等院校技术优秀教材ISBN:711803746作者:王炳锡屈丹彭煊出版社:国防工业出版社本书从语音识别的基本理论出发,以“从理论到实用”为主线,讲解了国际上最新、最前沿的语音识别领域的关键技术,从语料库建立、语音信号预处理、特征提取、特征变换、模型建立等方面详细介绍了语音识别系统建立的过程,并针对语音识别系统实用化的问题,给出了一些改善语音识别系统性能的关键技术,力求语音识别能走出实验室,向实用发展。
  全书共分四个部分(17章),第一部分介绍语音识别的基本理论;
第二部分介绍实用语音识别系统建立的过程;
第三部分列举了语音识别系统工程化所需的关键技术;
第四部分对语音识别的4个主要应用领域进行了详尽的、深入浅出的讲解,并根据最新的研究与实验结果提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与实用性。
章节之间紧密配合、前后呼应,具有很强酶系统性。
同时,通过书中的研究过程和研究方法,读者能够在以后的研究工作中得到很大的启发。
  本书可作为高等院校理工科通信和信息处理及相关专业的高年级本科生和(硕士、博士)研究生的教材或参考书,也可供从事信息处理、通信工程等专业的研究人员参考。
  目录:  第1章绪论  1.1概述  1.2语音识别综述  1.3国内外语音识别的研究现状和发展趋势  参考文献  第一部分基本理论  第2章听觉机理和汉语语音基础  2.1概述  2.2听觉机理和心理  2.2.1语音听觉器官的生理结构  2.2.2语音听觉的心理  2.3发音的生理机构与过程  2.4汉语语音基本特性  2.4.1元音和辅音  2.4.2声母和韵母  2.4.3音调字调  2.4.4音节字构成  2.4.5汉语的波形特征  2.4.6音的频谱特性  2.4.7辅音的频谱特性  2.4.8汉语语音的韵律特征  2.5小结  参考文献  第3章语音信号处理方法--时域处理  3.1概述  3.2语音信号的数字化和预处理  3.2.1语音信号的数字化  3.2.2语音信号的预处理  3.3短时平均能量和短时平均幅度  3.3.1短时平均能量  3.3.2短时平均幅度  3.4短时过零分析  3.4.1短时平均过零率  3.4.2短时上升过零间隔  3.5短时自相关函数和平均幅度差函数  3.5.1短时自相关函数  3.5.2短时平均幅度差函数  3.6高阶统计量  3.6.1单个随机变量情况  3.6.2多个随机变量及随机过程情况  3.6.3高斯过程的高阶累积量  3.7小结  参考文献  第4章语音信号处理方法--时频处理  4.1概述  4.2短时傅里叶变换  4.2.1短时傅里叶变换的定义和物理意义  4.2.2基于短时傅里叶变换的语谱图及其时频分辨率  4.2.3短时傅里叶谱的采样  4.3小波变换  4.3.1连续小波变换  4.3.2二进小波变换  4.3.3离散小波变换  4.3.4多分辨分析  4.3.5正交小波包  4.4Wigner分布  4.4.1Wigner分布的定义  4.4.2Wigner分布的一般性质  4.4.3两个信号和妁Wigner分布  4.4.4Wigner分布的重建  4.4.5Wigner分布的实现  4.5小结  参考文献  第5章语音信号处理方法--倒谱同态处理  5.1概述  5.2复倒谱和倒谱  5.2.1定义  5.2.2复倒谱的性质  5.3语音信号的倒谱分析与同态解卷积  5.3.1叠加原理和广义叠加原理  5.3.2同态解卷特征系统和同态解卷反特征系统  5.3.3同态解卷系统  5.3.4语音的复倒谱及同态解卷  5.4避免相位卷绕的算法  5.4.1最小相位信号法  5.4.2递归法
2025/2/21 15:39:21 11.75MB 语音识别
1
本程序特点及用途: 0.用VC6.0在字符窗口实现的MIDI钢琴和简谱编曲2合1程序;用于试听电脑MIDI合成器的127种标准音色;[按F1看操作说明;] 1.演示模块化编程风格;--分为项目主程序(包含外部库)/项目自定义(全局)/本地主模块函数/通用本地函数(公用)几部分;[请参考源代码;] 2.可编写多首音乐并依次播放;--增加'\0'全部歌曲结束标志; 3.弹奏和自动演奏都可任意指定乐器音色;编号0~127; 4.颤音延音;--默认打开;可作为练习实现开关控制; 5.变调功能;--很容易实现,可作为练习自己增加; 6.复音功能;--因程序变动过大,以后在GDI项目中实现;
2025/2/21 3:38:12 548KB winapi c语言 c++ 源码
1
verilog八音电子琴课设仿真程序八音电子琴仿真程序八音电子琴
1
音响放大器NE5532+TDA2030APROTELDXP原理图单声道带高低音控制电位器
2025/2/20 12:10:14 282KB NE5532+TDA2030A
1
一、激趣导入,引出课题。
1.(课件出示1)图片——摇摇欲坠的老屋。
2.学生认真观察图片,互相交流这是一座的老屋。
3.教师小结,导入课题。
(课件出示2)12总也倒不了的老屋(学生齐读课题)二、初读全文,认识生字  1.初读课文。
  (1)学生听课文的录音,边听边画出本课的生字新词。
  (2)自由读课文,(课件出示3)要求:  ①读准字音,读通顺句子。
②边读边思考,在不理解的地方做上记号。
  2.检查读书情况。
  (1)(课件出示4)生字,读生字。
dònɡzhǔnbèibàoqiángbìèzhīzhūpiāozhuànɡbǎo洞准备暴墙壁饿蜘蛛漂撞饱shài晒自己练读,指名读。
师生共同正音:注意读准翘舌音“准、蜘、蛛、撞、晒”,后鼻音“洞、墙”等。
(2)(课件出示5)词语,读词语。
  暴风雨往前凑喵喵孵小鸡叽叽好饿偶尔自由读,小组读,指名读。
注意读准:平舌音“凑”,三拼音节“喵”。
(开火车读,齐读)3.学生以自己喜欢的方式再读一读这个故事(可以独自读,也可以和同桌合作读),看看哪些地方使你受到感动,做做记号,再有感情地朗读体会。
4.组长汇报,全班交流,师引导学生评价所提出的问题,并解决疑问。
(相机进行词句训练和朗读指导)
2025/2/15 6:58:48 70KB 12总也倒不了的老屋教案
1
共20777字,包括多音信息,从unihan里提取出来的,仅供研究参考使用。
GBK共21003个汉字,以上不包含的汉字几乎都是日韩汉字。
2025/2/14 20:02:24 1.11MB GBK 汉字 拼音
1
【老八音源】LaoBa.zip
2025/2/7 17:12:35 16.88MB 音源
1
从零开始学习音视频编程技术(二十一)录屏软件开发之最终完善这是Qt的工程,建议使用QtCreator打开Qt的版本是4.8.4,当然是用Qt5也是没有影响的,不过编译器记得使用Mingw。
FFMPEG的版本是2.5.2记得将ffmpeg/bin目录下的dll文件拷贝到编译生成的exe所在的目录下,否则会无法运行。
关于代码的解释请参考:http://blog.yundiantech.com/?log=blog&id=28Qt开发环境的搭建请参考:http://blog.yundiantech.com/?log=blog&id=6Qt中引用FFMPEG库文件请参考:http://blog.yundiantech.com/?log=blog&id=7学习音视频技术欢迎访问http://blog.yundiantech.com音视频技术交流讨论欢迎加QQ群121376426
2025/2/7 10:25:49 17.43MB ffmpeg
1
找遍互联网找不到一个像样的,还是自己做一个吧!保证下了不后悔的音频内容:叮咚【音效】您有新的订单请及时处理并带有背景音乐^_^ps:不是我本人太贪心,只能设1-5分,我不管设多少需要的积分总会变40多!再改一次4分,还不行就放弃了
2025/2/7 5:17:07 217KB 叮咚 新订单 提示音
1
基于JavaWebSocket做信令服务器,使用webrtc浏览器和服务器只需要完成一次握手,两者之间就直接可以创建持久性的连接,并进行双向数据传输。
从而实现音视频通话。
下载启动输入http://localhost就可使用
2025/1/30 0:08:41 89KB webrtc java websocket 视频处理
1
共 472 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡