本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31 53.17MB sphinx 中文 语音 训练
1
天下陶网络商城主要分为:前台游客浏览、普通用户操作和后台管理3部分。
结合目前网上购物平台系统的设计方案,本项目具有以下特点:界面设计美观大方、操作简单。
功能完善、结构清晰。
普通用户的购物操作。
能够实现后台用户和商品管理。
能够实现推荐商品的操作。
能够实现后台对用户、订单、商品的管理。
操作注意事项一:进用后台地址为:http://localhost:8080/Shop/admin/user/user_login.html本系统的后台用户名为:admin,密码为:admin。
二:系统注册页面中提供了验证信息,用户只有添加了合法的信息后,才能注册成功。
三:被系统数据库为mysql配置文件hibernate.cfg.xml只需修改里面的数据库名密码即可四:系统自行修改了action请求为html所以大家不要感到诧异详细见struts.properties文件struts.action.extension=html操作流程通过系统首页,可实现浏览系统推荐商品、热销商品、以及各种分类商品等内容,也可以通过首页提供的“登录”、“注册”超链接来登录系统或注册新用户。
注意由于需要与银行交互,一些页面无法实现,读者可以根据自己的需要模拟实现相应功能。
数据库导入乱码解决方案首先在新建数据库时一定要注意生成原数据库相同的编码形式,如果已经生成可以用phpmyadmin等工具再整理一次,防止数据库编码和表的编码不统一造成乱码。
方法一:通过增加参数–default-character-set=utf8解决乱码问题mysql-uroot-ppassword<path_to_import_file–default-character-set=utf8方法二:在命令行导入乱码解决1.usedatabase_name;2.setnamesutf8;(或其他需要的编码)3.sourceexample.sql(sql文件存放路径)方法三:直接粘贴sql文件里的代码1.打开SQLyog客户端软件;2.定位到SQL编辑器,然后用记事本打开刚刚导出的SQL文件;3.复制文件中所有SQL语句到SQL编辑器当中,执行这些SQL代码;方法四:用记事本或其他文本工具改变SQL文件的编码格式(若方法三不行,那就尝试方法四)1.用记事本(或UE)打开刚才的导出的SQL文件;2.另存此文件——打开另存为对话框,选择对话框中的编码格式为UNICODE编码;3.保存文件,然后CTRL+A,全选;4.复制里面的SQL语句到SQLyog中的“SQL编码器”当中,再执行一次SQL语句;5.执行完成后切记刷新一次,查看中文的数据表,乱码消除,大功告成;
2023/8/2 2:54:48 17.05MB java ssh 商城 源码
1
跨平台(windowsLinux)是纯c实现gbk/utf8互转,Ansi/Utf8互转,
2023/7/18 20:11:28 87KB Ansi/Utf8 gbk/utf8 Ansi转Utf8 互转
1
一款由日本人开发的非常优秀的文本编辑器,里面的编码转换功能很有用,对MYSQL4.0.X升级到其他版本或降级的用户很有帮助。
例如GB2312->UTF8,或者相反。
对于对日软件开发者非常有用。
2023/7/4 12:15:32 4.53MB 日语 解码
1
新版本,比上个版本chen6013143发布的更全点,自己辛苦编辑的,禁止盗版,其中区号、邮编和坐标太麻烦了,没有添加全,有需要的自己在编辑下吧,表结构如下:idbigint(45)(NULL)YES(NULL)select,insert,update,references区划IDparent_idbigint(45)(NULL)YES(NULL)select,insert,update,references父级IDnamevarchar(45)utf8_binYES(NULL)select,insert,update,references全称merger_namevarchar(200)utf8_binYES(NULL)select,insert,update,references全称聚合short_namevarchar(45)utf8_binYES(NULL)select,insert,update,references简称merger_short_namevarchar(200)utf8_binYES(NULL)select,insert,update,references简称聚合level_typevarchar(45)utf8_binYES(NULL)select,insert,update,references级别city_codevarchar(45)utf8_binYES(NULL)select,insert,update,references区号zip_codevarchar(45)utf8_binYES(NULL)select,insert,update,references邮编pinyinvarchar(45)utf8_binYES(NULL)select,insert,update,references全拼jianpinvarchar(45)utf8_binYES(NULL)select,insert,update,references简拼first_charvarchar(45)utf8_binYES(NULL)select,insert,update,references首字母lngvarchar(45
2023/6/14 0:41:07 872KB 行政区域 mysql区域 区域编码 mysql
1
压缩包内包含客户端imclient.c服务端imserver.c以及makefile,测试在64位centos机器下运行,需要安装mysql数据。
程序流程,客户端通过读取图片数据然后通过socket将图片数据发送给服务端,服务端接收数据后,插入数据库。
注意;数据库字段位blob类型,UTF8编码格式。
2023/6/6 15:53:56 2KB linux c socket通信 存储图片
1
从一级到七级叶子类目。
CREATETABLE`dim_itemcat`(`cat_id`BIGINT(20)NULLDEFAULTNULLCOMMENT'类目ID',`name`VARCHAR(50)NULLDEFAULTNULLCOMMENT'类目名称',`parent_cid`BIGINT(20)NULLDEFAULTNULLCOMMENT'父类目ID',`is_parent`VARCHAR(10)NULLDEFAULTNULLCOMMENT'是否为父类目',`level`INT(1)NULLDEFAULTNULLCOMMENT'层级',`related`INT(1)NULLDEFAULTNULL,`is_track`INT(1)NULLDEFAULTNULL,UNIQUEINDEX`cid_unique`(`cat_id`)USINGBTREE,INDEX`cid`(`cat_id`)USINGBTREE,INDEX`level`(`level`)USINGBTREE,INDEX`name`(`name`),INDEX`is_track`(`is_track`))COMMENT='行业类目维度表:二列各式'COLLATE='utf8_general_ci'ENGINE=InnoDB;
2023/5/31 7:28:05 212KB 123
1
一、Qt实现的gbk/utf8无bom文本转码小货物二、用到了QDirQDirIterator递归文件目录三、QTextStream以某种编码格式读取文本留存到QString,而后以另一种编码格式留存文本代码比力约莫。
2023/5/5 22:51:31 255KB 文本转码
1
1以非图片方式在Datawindow中展现QR二维码2GBK以及UTF8编码相互转换3加密解密RSA加密解密4取汉字拼音首字母5文件哈希算法:MD5SHA1RIPEMD160SHA256TigerSHA512WhirlpoolCRC326字符串哈希算法:MD5SHA1RIPEMD160SHA256TigerSHA512WhirlpoolCRC32
2023/4/15 3:31:06 545KB pb powerbulider
1
Notepad++是Windows操作体系下的一套文本编纂器(软件版权应承证:GPL),有残缺的中横蛮接口及反对于多国语言编写的成果(UTF8本领)。
2023/4/5 7:55:33 3.98MB 开发工具
1
共 75 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡