本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31 53.17MB sphinx 中文 语音 训练
1
ZOC是一款远程登录软件。
支持ANSI,VT52,VT100,VT102,VT220,IBM3270和SecureShell(SSH)等选项多多,功能多多。
ZOC是一款以出色的配置和简洁的用户界面而闻名的功能强大且行之有效的终端模拟器和telnet客户端。
可以上传和下载。
ZOC类似于Windows下的SecureCRT,是一款用于连接运行包括Windows,MAC,UNIX/Linux和VMS的远程系统的工具。
它具有行标签定制,历史命令,回溯,多窗口,自动生成所有键入命令以及显示结果的记录文件,脚本和自动化等功能,兼容Windows7和OSXLion,拥有友好的管理员配置界面,并可进行文件传输等等。
同时支持Telent和Rlogin协议。
这个软件主要适用于从事相关行业的专业人员使用,用于包括远程网络调试、远程系统调试、本地网络、系统调试、排障等等诸如此类需要用到终端调试类的工作需要。
2023/8/11 9:29:28 4.22MB mac zoc ssh
1
appid:="************" apikey:="***********88" curtime:=strconv.FormatInt(time.Now().Unix(),10) param:=make(map[string]string) param["engine_type"]="sms16k" param["aue"]="raw" tt,_:=json.Marshal(param) base64_param:=base64.StdEncoding.EncodeToString(tt) w:=md5.New() io.WriteString(w,apikey+curtime+base64_param) checksum:=fmt.Sprintf("%x",w.Sum(nil)) body,_:=ioutil.ReadFile("./ceshi.pcm") base64_audio:=base64.StdEncoding.EncodeToString(body) data:=url.Values{} data.Add("audio",string(base64_audio)) res_body:=data.Encode() client:=&http.Client{} req,_:=http.NewRequest("POST","http://api.xfyun.cn/v1/service/v1/iat",strings.NewReader(res_body)) req.Header.Set("X-Appid",appid) req.Header.Set("Content-Type","application/x-www-form-urlencoded") req.Header.Set("X-Param",base64_param) req.Header.Set("X-CheckSum",checksum) req.Header.Set("X-Curtime",curtime) response,_:=client.Do(req) deferresponse.Body.Close() resp_body,_:=ioutil.ReadAll(response.Body) fmt.Print(string(resp_body))
2023/8/8 21:12:27 1KB 科大讯飞 go语言 语音转写
1
1.在linux中实现一个命令执行程序doit,它执行命令行参数中的命令,之后统计1)命令执行占用的CPU时间(包括用户态和系统态时间,以毫秒为单位),2)命令执行的时间,3)进程被抢占的次数,4)进程主动放弃CPU的次数,5)进程执行过程中发生缺页的次数
2023/8/8 16:47:13 3KB 华南理工大学 操作系统
1
Xftp7是一种灵活且轻量级的SFFT/FTP客户端,用于需要安全地通过网络传输文件的用户。
使用Xftp7软件能让文件传输被简化,使用拖拽、直接编辑和增强的同步,这些特性在直观的标签界面中被封装。
它可以帮助你的电和远程计算机进行文件同步,支持Windows和UNIX/Linux之间传输,完美支持SFTP、FTP传输,使用简单、快捷深度用户喜爱,同时Xftp7中文版具有很好的安全性,你完全可以放心自己的数据在传输中不被泄漏重要的是可以自定义上传文件的编码可以有效解决由WINDOWS平台访问LINUX平台FTP中文件名乱码的问题
2023/8/5 16:36:12 75.79MB FTP
1
古玩Curio是一个基于协程的库,用于使用async/await进行并发Python系统编程。
它提供了标准的编程抽象,例如任务,套接字,文件,锁和队列,以及一些高级功能,例如对结构化并发的支持。
它可以在Unix和Windows上运行,并且具有零依赖性。
您会发现它熟悉,小巧,快速且有趣。
古玩是不同的软件体系结构中最重要的想法之一是“关注点分离”。
这可以采取多种形式,例如利用抽象层,面向对象的编程,方面,高阶函数等。
但是,它的另一种有效形式存在于分离执行环境的想法中。
例如,操作系统中的“用户模式”与“内核模式”。
这是Curio中的基本思想,但是适用于“异步”执行与“同步”执行。
异步代码的一个基本问题是,它涉及完全不同的评估模型,该模型无法与普通应用程序或其他并发方法(例如线程编程)很好地结合在一起。
尽管在Python中添加了“异步/等待”功能有助于澄清此类代码,但
2023/8/4 18:40:10 266KB Python
1
c#实现FTP服务器,功能①、按标准FTP协议登录FTP服务器,进行身份验证;
②、显示远程目录、文件列表,进行目录切换;
③、目录、文件列表的排序显示(文件名、时间、类型);
④、能上传文件、下载、删除文件;
⑤、支持设置选择二进制、文本格式文件传输(UNIX标准的文本);
2023/8/1 9:02:34 465KB FTP 服务器
1
可以运行于Linux/FreeBSD/Unix及微软Windows2000/2003等各种操作系统环境下。
您需要做好服务器操作系统级的安全防备措施,例如Windows用户需更改MySQLforWindows的初始root密码,避免跨目录的文件读写;
Unix用户需避免使用过于简单的密码,避免跨用户目录的文件读写,做好服务器上其他相关软件(如Sendmail,ftpd,httpd)等的安全防范,使用较新的软件版本等。
推荐使用Linux操作系统,不仅完全免费,而且可以获得更好的稳定性和负载能力
2023/7/30 3:09:39 5.35MB crm thinkphp crm php
1
讲的是设备文件管理Linux沿袭Unix的风格,将所有设备认成是一个文件。
设备文件分为两种:块设备文件(b)字符设备文件(c)
2023/7/28 6:51:16 2.09MB linux
1
liunx版本3.29.2-02
2023/7/27 10:45:25 154.87MB maven私服 nexus3.2.x maven nexus
1
共 316 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡