本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31 53.17MB sphinx 中文 语音 训练
1
全球领先的市场咨询公司,专注研究产品创新及趋势,并持续追踪产品、消费者及竞品,国内20余家乳品及相关原料企业产品创新的长期合作伙伴
2023/8/12 0:08:19 3.65MB Mintel
1
本文通过分步法解决了大订单下的皮革下料问题;
先将原料牛皮分成几部分,分别寻找最佳切法,用整型规划的方法找到最优解。
利用率达到了58%
2023/6/6 22:39:12 1.02MB 皮革下料问题 浙大数模
1
一、单项选择题(共20题,每题1.5分,共计30分;
每题且仅有一个正确选项)1.计算机如果缺少(),将无法正常启动。
A.内存 B.鼠标 C.U盘 D.摄像头2.()是一种先进先出的线性表。
A.栈 B.队列 C.哈希表(散列表) D.二叉树3.目前计算机芯片(集成电路)制造的次要原料是(),它是一种可以在沙子中提炼出的物质。
A.硅 B.铜 C.锗 D.铝
2023/3/4 16:24:27 84KB NOIP2012普及组初赛试题答
1
1.新发布的《环境空气质量标准》中增加了PM2.5监测指标。
PM2.5是指大气中直径小于或等于2.5微米的颗粒物,对人体健康影响很大,次要来源之一是化石燃料的燃烧。
下列措施能减少PM2.5污染的是A.鼓励开私家车出行B.鼓励使用太阳能热水器C.鼓励用煤火力发电D.鼓励用液化石油气作燃料2.下列有关空气和氧气的叙述不正确的是A.空气中的氮气是制造硝酸和氮肥的重要原料B.空气中的稀有气体都没有颜色、没有气味,在通电时能发出不同颜色的光C.氧气可以支持燃烧,说明氧气具有可燃性D.氧气供给呼吸,它和体内物质反应,释放能量,维持生命活动的需要
2020/7/14 17:03:19 1.09MB 2019-2020学年度九年级化
1
善用长度并降低了原料,使原料只有一个最低需要。
降低物质需求,并降低kosts。
适用于所有材料是线性的,优化的长度。
2018/3/12 21:45:20 216KB 切割优化
1
一、功能介绍1、员工名单:添加员工、删除员工、修改员工、记录考勤。
2、原料管理:添加信息、补进原料、修改信息、删除信息。
3、成品管理:主要是成品信息的增删改查。
4、订单管理:添加买卖信息、修改订单信息、买卖完成。
5、资金结算二、注意事项1、开发环境为VisualStudio2010,数据库为SQLServer2008,数据库文件在DB文件夹中,使用.net4.0开发。
2020/5/13 20:25:30 2.68MB SQLServer2008
1
关于r-shinydashboard主页::套件授权:GPL-2.0或更高版本原料许可证:BSD3-条款摘要:使用“发光”创建仪表板。
该软件包在“发光”的顶部提供了一个主题,使创建有吸引力的仪表板变得容易。
当前构建状态所有平台:当前发行信息姓名材料下载版本平台类安装r-shinydashboard安装r-shinydashboard从conda-forge通道可以通过添加可以实现conda-forge到您的频道:condaconfig--addchannelsconda-forge一旦conda-forge信道已被启用,r-shinydashboard可以安装有:condainstallr-shinydashboard可以列出平台上可用的所有r-shinydashboard版本,其中包括:condasearchr-
2021/6/4 12:13:17 15KB Shell
1
这个系统只需你生产过程的记录存在关联,就能很迅速追溯出该批产品是用什么原料生产的,原料供应商是谁,产品销售到那里,都是一键完成!
1
基于工业食品互联网handle安全标识解析,分析定义航空食品原料安全管理零碎,实现航空食品原料安全、可追溯
2020/3/10 12:06:20 53KB 原料 handle 可追溯 标识解析
1
共 24 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡