首页
熊猫办公下载
文件下载
根据地址查询经纬度
登录 / 注册
一级分类:
安全技术
存储
操作系统
服务器应用
行业
课程资源
开发技术
考试认证
数据库
网络技术
信息化
移动开发
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
二级分类:
sphinx中文语音训练手册
本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31
53.17MB
sphinx
中文
语音
训练
1
IntelVisualFortranComposerXE2013.lic
IntelVisualFortranComposerXE2013许可证书,可以支持2013版Fortran的破解。
2023/8/12 3:34:29
644B
Fortran2013
1
王道2013年最后8套模拟题+答案.rar
王道2013年最后8套模拟题+答案.rar
2023/8/12 2:37:02
6.34MB
王道
2013
模拟题
答案
1
北京市公交线路图_Arcmap矢量格式
2013年北京市公交线路及公交站点Arcmap矢量图.数据来源BCLBeijingCityLab。
2023/8/7 8:21:12
4.76MB
北京市
公交线路
矢量图
arcmap
1
MyEclipse2017CI1破解工具及教程
MyEclipse2017CI1的破解网上的例子都他妈太假了,破解了半天没成功,淘宝花了10元,然后造福大家.包含了注册机和破解教程,破解教程我看了,十分的详尽,包含了破解失败的情况,亲测有效,且版本之间关系不大,从2013到目前最新版的MyEclipse均适用
2023/8/6 22:11:50
2.74MB
MyEclipse
1
2013年全国大学生电子设计竞赛综合测评,波形变换仿真
2013年电子设计竞赛山东赛区13年综合评测multisim14.0仿真.555产生脉冲波,积分电路产生锯齿波,二阶有源低通滤波器产生正弦波,带通滤波器产生三次谐波。
说明:最后的三次谐波峰峰值偏小。
2023/8/6 13:45:08
1016KB
2013年综合测评题
电子设计竞赛
multisim14.0仿真
波形变换
1
数学建模之全球环境统计数据(一)
该文件为全球及中国环境统计的部分数据。
涉及方面包含全国194个统计点从1951年至2013年降雨量数据统计,2000-2014年中国各省市环境质量统计,各省年度供水统计,全球人造地表覆盖数据统计……
2023/8/1 15:54:07
173.15MB
数学建模
环境数据
环境
气候
1
MC9S08DZ60评估板例程_程序_开发板手册
包括MC9S08DZ60开发板说明书,以及详细的例程:2013-01-11上午11:20ACMP2013-01-11上午11:20ADC2013-01-11上午11:20Buzzer2013-01-11上午11:20CAN2013-01-11上午11:20can总线流程图2013-01-14下午01:34eeprom2013-01-11上午11:20Flash2013-01-11上午11:20IIC_24C022013-01-11上午11:20IIC_85632013-01-11上午11:20Irq2013-01-11上午11:20KBI2013-01-12上午09:03Key2013-01-11上午11:20Key_LED2013-01-11上午11:20LCD122322013-01-11上午11:20LCD16022013-01-11上午11:20LED2013-01-11上午11:20LVD2013-01-11上午11:20MCG_PLL2013-01-11上午11:20NRF24L01_IO2013-01-11上午11:20NRF24L01_SPI2013-01-11上午11:20rst2013-01-12下午05:14rtc2013-01-12下午05:04SCI2013-01-11上午11:20SPI2013-01-11上午11:20stop22013-01-11上午11:20stop32013-01-11上午11:20tpmpwm边沿输出2013-01-11上午11:20tpm自由溢出2013-01-11上午11:21wait
2023/7/29 23:03:38
8.36MB
MC9S08DZ60
例程
1
2013-2020年暨南大学714基础生态学考研真题
该资源为2013-2020年暨南大学714基础生态学考研真题,资源高清无水印哦!该资源为2013-2020年暨南大学714基础生态学考研真题,资源高清无水印哦!
2023/7/27 23:23:27
1.12MB
2013-2020年暨南大学
暨南大学
暨南大学714基础生态学
714基础生态学
1
2013-2017历年的软考数据库系统工程师真题和答案
2013-2017历年的软考数据库系统工程师真题和详细答案。
2023/7/26 15:47:27
15.83MB
软考
1
共 371 条记录
首页
上一页
下一页
尾页
钉钉无人值守自动打卡脚本 永不迟到的神器 安卓和苹果教程
New!
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03
15KB
钉钉
钉钉打卡
个人信息
点我去登录or注册
|
微信登录
一言
热门下载
双系统双频伪距单点定位程序
中科院考博英语2009-2018年试题及答案解析(十五套436面).pdf
Docker构建tomcat镜像jdk1.8+tomcat9.zip
飘逸传世引擎源代码
新升级版TP5商城小程序源码+公众号版+h5一整套源码V3.zip
CNS2_CN_VW_P0095D_0332.7z
几何画板课件350套.zip
R9390系列BIOS修改和风扇调速工具
HTML5+CSS3中文参考手册(3手册)chm版中文参考手册打包
KEPServerEXV6.7.zip
吉利新金刚2016款车机导航系统
ABAQUS金属非稳态和稳态切削过程的模拟分析_张东进.pdf
ENVI去云补丁Haze_tool文件及其使用说明和安装方法
vue项目demo(asp.netmvc5+vue2.5)
高光谱和LiDAR多模态遥感图像分类数据集
最新下载
锅炉原理下-高教-西安交通大学
大华视频C#DEMO
ANDROIDadb31,32,39
舒姗-数字电压表-09自动化2班-5号.rar
CM-R湿敏电阻性能指标阻值与湿度关系曲线.pdf
todo-list:编码DojoTodo列表分配-源码
yolo.h5算法权重
基于jsp的图书管理系统源代码
实现音乐推荐系统(源代码)
图像测试数据库USC-SIPI
NASA铣削数据集(MillingDataSet)
Windows3D图形编程
使用控件的类-精通windows3d图形编程
计算机组成原理课程设计-硬布线加中断ABEL代码
中国土地利用数据(grid格式)
其他资源
数据结构教程(第5版)-源程序
HMC833.zip
基于神经网络车牌识别识别
基于安卓Android的火车票查询系统
asp+access的一个网站模板
自顺应信号处置测验题
64QAM系统性能的分析
电脑配置信息获取.exe
1.高程计算.rar
欧姆龙FH视觉和CP1H通过EIP通信
【ssm项目源码】高校学籍信息管理零碎.zip
TC1782中文数据手册
flask-swagger:用于烧瓶的swagger2.0规格提取器-源码
FPGA VHDL FIFO 源代码
最全最稳E-cology8.x授权生成器.rar
先生跟踪系统-源码
智慧医院原型图
S6C0671_V0.0_20000201.pdf
C#H264格式视频解码
jsp+servlet超市后台管理零碎