最最简单的AForge.net视频录制示例,没有录制声音的功能,只有视频
2023/8/14 11:37:48 12.3MB AForge 录制
1
本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31 53.17MB sphinx 中文 语音 训练
1
信号与系统大作业:声音信号的频谱分析问题1:同一首歌曲,不同演唱者的区别在哪里?问题2:歌曲添加噪音后对其有何影响?问题3:男声和女声有什么显著的区别吗?问题4:对噪声进行滤波,是否可以提高音质,达到降噪功能?
2023/8/10 0:35:28 1.42MB 信号与系统 频谱分析 matlab仿真
1
matlab实现男女变声的代码可把自己(男)的声音分别变成小孩的声音、女人的声音和老人的声音。
2023/8/9 20:58:56 247KB matlab 变声
1
报警声音wav格式,希望大家会喜欢,谢谢。
2023/8/9 12:56:20 2.2MB 信息化声音报
1
运行环境:服务器需要:InternetInformationServer5.xor6.0(iis5.0以上版本)SQLServer2000/以上版本,oraccess2002-access2003客户端需要:浏览器需要IE6.0或以上服务器最低配置:操作系统:中文Windows2000/2003CPU:赛扬3内存:256MBMSSQL2000/以上版本(安装SQL版必须,大小1G)空间大小:1G(纯文字)服务器建议配置:操作系统:中文Windows2000/2003CPU:P42.6G以上内存:512MB以上MSSQL2000/以上版本(安装SQL版必须,大小1G以上)空间大小:10G以上(文字+图片版)安装步骤:1.此版本只适合全新安装的用户如果使用MSSQL数据库格式有自己服务器的请新建一个空数据库步骤如下:---------------------------------------------    第一步、新建数据库    ---------------------------    打开企业管理器--展开“SQLServer组”--“数据库”(点击右键)--“新建数据库”(打开数据库属性对话框)--输入数据库名称(数据库名称请用英文数字)确定    第二步、新建数据库用户    ---------------------------    展开控制台目录--“安全性”--“登录”--右键“新建登录”--打开新建用户登录对话框---“名称”用户名称请用英文--选择“SQLServer身份验证(S)”--输入密码--“数据库(D)”请选择刚才新建的数据库---切换到“数据库访问”--选择刚才新建的数据库--“数据库角色中允许”--选择“public”,“db_owner”--确定--提示再次输入密码--完成------------------------------------------购买MSSQL数据库和使用ACCESS格式數據庫的直接跳过本步骤2.运行"Installer"目录中的安装程序"default.htm"完成后将"Installer"目录删除,否则再次运行可造成数据库损坏。
3.然后进入后台重新生成前台美化页面(后台==》美化模版管理==》添加美化模板或直接采用默认模版,生成所有前台页面),否则将无法正常运行。
4.HTML模块部分功能提供测试.5.VIP模块由于正在进行整合功能暂时不提供关于系统没有默认管理员的说明:系统系空数据库纯安装建立的数据库结构,所以不提供默认管理员及密码,以求更高的安全性.同样,系统的安装目录、数据库目录、数据库备份目录及系统后台目录都是由使用者自行设定的,同样也是安全性的表现。
本系统大面积使用“Scripting.FileSystemObject”即FSO文本读写组件,如果服务器不支持则不能使用。
由于部分杀毒软体有针对使用“Scripting.FileSystemObject”操作文件的模块,会出现自动删除文件,而导致系统文件严重丢失的情况.(甚至压缩包里的文件也能被删除,使原本400多K的压缩包缩水为200多K,不能解压,好似没有下载完成.)以至于不能使用.那只能请你换用其他小说系统了.也会出现部分文件被报毒,实属误报,如果你的确不敢使用,那也请换用其他小说系统。
功能介绍:一、会员功能模块1、站内短信发布可以随时跟网站内的用户、作家、管理员进行站内短信通讯,如果用户不在线,会自动保存。
待用户上线之后,声音提示短信。
用户可随意保存短信条数,但不能超过系统指定的保存容量,否则将无法接收。
(可在后台按照个人喜好而设置)2、书架收藏夹(包含書簽,网络书签)注册用户可以随时收藏自己喜欢的图书,收藏图片数量随用户积分及等级而变化(管理員可以自由設定)。
3、发表评论由于本次会员以积分定位,所以用户每次发表评论时都会增加一定数量的积分,但如果恶意发表的话,每删除一条就会被减少一倍的积分。
(系统清理自动清理的评论则不减任何积分)如:发布一条评论积分为5,但如果这条评论被管理员删除则减用户积分为10。
此设置可在后台按照个人喜好而设置4、短篇文集所有註冊會員在成功註冊的同時即擁有發表諸如:散文、詩詞、評論、雜文、日記等一些短小的文章形成自己的文集。
5、用户广告(预定功能模块,暫未完成)用户以自己的ID为网址,每次为网站拉来一个流量,都会被系统记录,而给予相应的奖励,为了防止恶意刷新,同一I
1
带声音的闹钟源代码,通过某开源闹钟修改添加做成的,是我的Android课作业,自认为写的还行,而且注释得很详细,需要就下吧
2023/8/8 17:19:51 9.74MB 闹钟 源代码 Android
1
捕鱼达人java版,一时改良的捕鱼游戏;游戏画面,声音,初始金币等等基本跟原版一致,声音是用AudioInputStream写的,用的线程在并发情况下会显示杂音,已经处理过,不太明显,在两三秒内连点数十下还是会感觉到,其他就没什么了,想直接启动的话,双击run.bat就行,也可以导入idea或eclipse由项目启动.
2023/8/7 11:37:52 12.81MB 捕鱼达人 游戏 改良 java
1
win32汇编实现扫雷,带图片资源于文件夹res中,基本实现windows自带扫雷功能,包括声音
2023/8/5 18:19:11 243KB 扫雷 汇编
1
基于Qt中QMediaPlayer类的简易视频播放器自定义Slider实现进度和音量控制若出现有声音无画面现象,建议安装K-Lite解码器
2023/8/5 9:40:15 9KB Qt QMediaPlayer
1
共 470 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡