本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31 53.17MB sphinx 中文 语音 训练
1
新兴技术研讨会:思科APIC-EM的网络可编程性CiscoAPIC-EM沙盒实例和凭据主要使用基于颜色编码的NetAcadAPIC-EM沙盒环境地区:目标受众新兴技术研讨会是一种让学生接触最新互联网技术的短期实践经验。
在每一个研讨会上,你将学习新概念,了解它们如何在现实世界的设备上工作,并迅速为当今的就业市场开发新技能。
8小时的教学模式使教师能够灵活地为现在和以前的学生提供为期一天的研讨会,让他们接触最新技术。
网络可编程性与思科APIC-EM研讨会探讨了网络可编程性领域。
本研讨会探讨了网络可编程性的概念,并为学生提供了创建Python程序的机会,该程序与CiscoDevN
2023/8/13 23:31:43 335KB APIC-EM CiscoDevN Python ccna
1
基于UML的陆军信息火力战概念建模
2023/8/13 11:14:17 430KB 研究论文
1
大数据的学习笔记,从大数据的基本概念包括Hadoop、hive、离线计算、实时计算、数据库、数据仓库、维度建模、大规模并行处理MPP,到阿里大数据产品,包括MaxCompute、DataWorks、数据集成、机器学习PAI、AnalyticDBforMySQL,和最后的概要说明
2023/8/12 15:18:33 1.8MB 大数据
1
本文来自csdn,文章先来卷积神经网络和全连接神经网络对比,接着让我们直观理解卷积,卷积计算流程,结合案例进行相关的介绍。
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。
它包括卷积层(convolutionallayer)和池化层(poolinglayer)。
对比:卷积神经网络、全连接神经网络左图:全连接神经网络(平面),组成:输入层、激活函数、全连接层右图:卷积神经网络(立体),组成:输入层、卷积层、激活函数、池化层、全连接层在卷积神经网络中有一个重要的概念:深度卷积
1
理解ContentUri的概念和作用,掌握通过ContentProvider访问联系人的方法,掌握通过ContentProvider访问通话记录的方法,掌握通过ContentProvider访问短信的方法。
2023/8/12 2:47:41 2.13MB Content Provider
1
决策树(DecisionTree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。
由于这种决策分支画成图形很像一棵树的枝干,故称决策树。
在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。
Entropy=系统的凌乱程度,使用算法ID3,C4.5和C5.0生成树算法使用熵。
这一度量是基于信息学理论中熵的概念。
2023/8/11 22:13:29 5KB 决策树
1
工资管理系统1、系统功能的基本要求: 员工每个工种基本工资的设定 加班津贴管理,根据加班时间和类型给予不同的加班津贴;
 按照不同工种的基本工资情况、员工的考勤情况产生员工的每月的月工资;
 员工年终奖金的生成,员工的年终奖金计算公式=(员工本年度的工资总和+津贴的总和)/12;
 企业工资报表。
能够查询单个员工的工资情况、每个部门的工资情况、按月的工资统计,并能够打印;
2、数据库要求:在数据库中至少应该包含下列数据表: 员工考勤情况表;
 员工工种情况表,反映员工的工种、等级,基本工资等信息;
 员工津贴信息表,反映员工的加班时间,加班类别、加班天数、津贴情况等;
 员工基本信息表 员工月工资表。
3、本课题设计的基本要求:(1) 必须提交系统分析报告,包括系统的功能分析、系统的功能模块设计、数据库的数据字典,数据库的概念结构(E-R图),数据库中的表、视图(如果使用)、存储过程(如果使用)的结构和定义(可以用SQL脚本提供);
(2) 程序设计的报告:包括程序的运行环境、开发环境、程序的详细设计(包括模块之间的关系,模块的功能、主要功能实现的程序段)(3) 系统的源程序,包括数据库脚本程序。
2023/8/11 6:42:43 124KB php 工资管理
1
《工程控制论(上册)(第3版)》系钱学森英文原著《EngineeringCybernetics》(工程控制论)一书的第三版。
原书曾荣获中国科学院1956年度一等科学奖金。
本版对第二版中的文字、符号等错误进行了补正。
第三版分上、下两册共二十一章。
上册十二章,下册九章。
《工程控制论(上册)(第3版)》保留了原书的基本内容。
在叙述方法上,也保持和发扬了原书的特点,由浅入深,既重视物理概念,又注意理论上的严谨性,把一般性概括性的理论和实际工程经验很好地结合起来。
在讨论系统分析和设计问题时,传递函数和状态空间的描述方法并重,互相补充。
《工程控制论(上册)(第3版)》对从事自动化、无线电电子学、航天技术及系统工程等专业的理论工作者和工程设计人员是一本有重要参考价值的著作,同时也可作为高等院校相关专业的教学参考书。
2023/8/11 1:47:24 22.93MB 工程控制论
1
Java后端高级面试题,涵盖关系型数据库、非关系型数据库redis、并发编程、Spring/SpringMVC、JVM、微服务、RabbitMQ等技术,冲!
2023/8/10 12:10:44 2.24MB java 面试题
1
共 1000 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡