本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31 53.17MB sphinx 中文 语音 训练
1
设计8088最小系统要求:1、用8088CPU,配置8284时钟芯片,提供CLK、READY、RESET信号。
8284芯片及周围器件参数见教材。
2、用3片74LS373做地址总线分离器,分离出20根地址线A0~A193、用1片74LS245做双向数据总线驱动器。
4、配置32KROM(27C256),用作BIOS存储器5、配置2*32KRAM(62256)为系统内存储器 6、配置标准I/O接口,总线包括:D0~D7、A0~A2、WR、RD、CS。
7、注意ALE、DT/R 、DEN控制线的用法8、3片存储器的片选可用3-8译码器的输出Y0、Y1、Y2控制,Y4可接I/O的片选.9、IO/M,WR、RD、可通过逻辑或门得到两组独立的读写线,分别控制内存和I/O的读写操作10、注意MN/MX引脚的处理,CPU其他未用的引脚可以不画11、按工程制图标注电路中各芯片的型号、引脚功能和引脚号,不可用总线或简化画法。
2023/8/10 10:23:27 58KB 微机原理制图
1
A2油气水井措施效果计算规则
2023/8/7 18:11:45 30KB A2 措施效果 计算规则
1
Description给定n个矩阵{A1,A2,…,An},其中Ai与Ai+1是可乘的,i=1,2,…,n-1。
如何确定计算矩阵连乘积的计算次序,使得依此次序计算矩阵连乘积需要的数乘次数最少。
Input输入包含多组测试数据。
第一行为一个整数C,表示有C组测试数据,接下来有2*C行数据,每组测试数据占2行,每组测试数据第一行是1个整数n,表示有n个矩阵连乘,接下来一行有n+1个数,表示是n个矩阵的行及第n个矩阵的列,它们之间用空格隔开.Output你的输出应该有C行,即每组测试数据的输出占一行,它是计算出的矩阵最少连乘积次数.SampleInput1310100550SampleOutput7500
2023/7/4 8:10:11 1KB 矩阵连乘问题
1
DELTA台达ASDA-A2伺服驱动器使用手册.pdf
2023/6/14 21:01:19 37.4MB 伺服电机 台达电机
1
本人实践成功刷机步骤:1、使用A2TOOL刷机工具前要安装驱动安装USBFlash_driver下的ggsetup-2.2.0.5.exe即可2、刷机需要.mbn格式的固件和.fbn格式的main固件,还要tpa.zip的闭合文件。
固件齐全后请按照教程刷机即可。
(此包fies目录下含索尼w980手机的三个文件cid:52)。
以w980机型为例:教程地址:http://bbs.imobile.com.cn/thread-tid-8731750.html或者打开:【W980】——A2固件刷机教程_索尼爱立信W980.mhtps:可以修复手机不能正常使用,白屏、黑屏、不能开机等系统问题。
2023/6/6 15:48:21 77.12MB 索尼 w980 刷机 R3CA038
1
USR-WIFI232-A2-hardware-V1.1wife模块使用手册
2023/5/2 18:25:30 4.75MB 电学
1
提出了一种多成果聚合物非对于称马赫曾经德尔干涉仪电光开关/滤波器,它搜罗两个串联的相位暴发耦合器以及一对于微带电极。
由于使用给定的非线性最小二乘类似法对于PGC结构举行了优化,于是实现为了相位赔偿前提以及消光比(ER)赔偿前提,以实现周期性的频率照料。
导通以及关断电压分别为0以及8.06V。
该配置配备枚举具备两个输入端口(A1以及B1)以及两个输入端口(A2以及B2),端口A2搜罗10个从#-7到#2编号的通道,端口B2搜罗9个从#-7到#1编号的通道。
作为光学滤波器(ON外形),每一个通道的波漫空间在19.2-21nm(尺度值20nm)之内,最大周期变更小于1nm。
端口A2的通道#-7至#2的插入损耗在2.69-19.3dB之内,端口B2的通道#-7至#1的插入损耗在2.09-20.2dB之内。
作为EO开关,端口A2在通外形以及关外形之间的每一个通道的ER均大于15.7dB,而端口B2的每一个通道的ER均大于12.6dB。
另外,依据CWDM收集的申请,在温度变更较大的情景下,该器件还具备精采的热平稳性。
2023/4/28 18:58:50 962KB Asymmetric Mach-Zehnder interferometer; Design
1
适用机型永大电梯调试解密软件:MPUGBMPUGB2;MPUGB2(A2)U31SB2P1(无按键版)MPG/U31版本:V1.四、V1.六、SB2P0
1
台达A2系列伺服接入canopen网络所需的eds设置装备摆设文件
2023/3/15 22:05:27 100KB eds
1
共 46 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡