首页
熊猫办公下载
文件下载
根据地址查询经纬度
登录 / 注册
一级分类:
安全技术
存储
操作系统
服务器应用
行业
课程资源
开发技术
考试认证
数据库
网络技术
信息化
移动开发
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
二级分类:
matlab编写的基于Gabor2DPCA人脸识别程序
自己用matlab编写的基于Gabor的2DPCA人脸识别程序,运行速度快,识别率较高,直接输出对Yale数据库的识别率。
本程序附带Yale数据库,可以直接运行。
通过修改训练样本的个数,输出不同的识别律,可以研究训练样本个数对识别率的影响。
2023/8/22 14:39:33
6KB
Matlab源码
2DPCA
Gabor
人脸识别
1
sphinx中文语音训练手册
本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。
本文档编写日期2013-04-231、为什么要训练?sphinx4目前的版本中仅提供了英文等语音识别库。
中文的库是PTM或semi类型的,在java版sphinx中无法使用。
2、Sphinx的训练指哪些内容?在Sphinx中有语言模型、声学模型等概念,如果你不想了解这些,请参考以下内容:a1、中文每个字的标准发音已经有一个较为全面的文件进行了标注这个文件就是zh_broadcastnews_utf8.dic(下称这类文件为发音字典),在sphinx网站上可以下载,我们也包含了它。
下面是该文件的片断,它用类似拼音的方式标注了每个字或词的发音。
昌chang昌北changbei昌必changbi昌都changdu昌赫changhea2、需要告诉sphinx我们经常使用的字、词是哪些,它们出现的频率如何由于开放式语音识别尚难实现,所以sphinx实际上只能较好的处理相对小的语言集合。
因此,针对特定的领域,告诉sphinx该领域的词汇和各词出现的频率将极大提高识别率。
a3、需要告诉sphinx每个字、词的真正读音发音字典告诉sphinx每个字的标准读音,但面对的说话人往往不会以标准读音来朗读。
因此sphinx需要学习说话人的“口音”。
如果训练时的读者发音比较标准,则sphinx能“举一反三”,识别其他不那么标准的读者的语音。
推荐的做法是训练一些典型的口音:标准男、女声,童音,最后再考虑特定用户的口音。
3、如何准备训练内容所需的原料?需要准备两大内容:1)文本语料文件,2)语料录音文件。
文本语料文件给出2.a2中需要的内容,在bergtrain的etc文件下的berginput.txt文件就是一个预料文件。
它以行为单位,给出了150个中文句子。
语料录音文件是根据文本语料文件,朗读它的每行/句话,保存到每一个语音文件即可。
语料文件中的语句应该尽量选择领域相关的,在覆盖领域内名词的前提下,覆盖尽可能多的通用词汇。
4、训练环境及注意事项本文的训练软硬件如下:硬件:T60P笔记本,机器自带录音设备;
操作系统为Win732位。
软件:Sphinx cmuclmtk-0.7-win32.zip pocketsphinx-0.8-win32.zip sphinxbase-0.8-win32.zip sphinxtrain-1.0.8-win32.zip sphinx4-1.0beta6-bin.zip,用于编写java版的识别软件所需的库 脚本执行软件 ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi ActivePython-2.7.2.5-win32-x86.msi 录音和处理软件 audacity-win-2.0.3rc1.zip,可进行录音和声音文件处理(如降噪),免费软件 FairStars.zip,可进行批量录音(V3.5绿色版) 文本编辑软件UltraEdit,UltraEdit-32.rar绿色版注意: 文件格式 语料文件必须使用UltraEdit进行编辑, 在编辑后,使用文件-转换-ASCII转UTF-8(UNICODE编辑),指定文件中的中文使用utf8编码。
在保存前,设置格式如下: 换行符:UNIX终束符-LF 指定文件中的回车/换行符为编码0A的换行符 格式:UTF-8-无BOM 每个文件的末尾必须有一个回车! 这个回车将在保存时被替换为编码0A的换行符,训练脚本需要这个符号来确认文件的结束。
录音文件 如果你不希望去编辑训练中的配置文件,则在使用FairStars录音时作如下设定: 进入菜单和对话框选项-显示录音选项-编码-WMA, 设定:采样率(16000Hz)、通道(单声道)、比特率(16Kbps)5、训练步骤下面逐步从零开始进行训练5.1软件环境的安装将本文档所在的文件夹解压或拷贝到d:\,即本文档路径是d:\sphinxtrain\Sphinx中文训练教程.txt1)点击安装ActivePerl-5.16.3.1603-MSWin32-x86-296746.msi和ActivePython-2.7.2.5-win32-x86.msi;
2)解压Sphinx中除sphinx4-1.0beta6-bin.zip外的压缩文件到d:\sphinxtrain下
2023/8/14 6:38:31
53.17MB
sphinx
中文
语音
训练
1
LINUX下完整的人脸识别算法(保证可以用)
linux下人脸识别算法,完整个的软件,基于QT,可以识别人脸,需要先训练,然后再识别,识别率虽然不是太高,但是完全是可以用的,功能强大。
2023/8/13 4:10:28
790KB
linux
人脸识别
算法
检测
1
基于听觉特性的声纹识别系统的研究
声纹识别技术,形象的说法就是说话人识别技术。
它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术。
本文所研究的是与文本有关的说话人确认系统。
比较了基于声道的线性预测倒谱系数(LPCC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性。
并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真。
本实验系统的识别率达到了90%,验证了HMM模型识别的准确性。
2023/8/10 15:50:09
1.61MB
声纹识别;线性预测倒谱系数;MEL频率倒谱系数;隐形马尔可夫模型
1
AndroidOCR文字扫描并将结果转换成Excel或PDF
AndroidOcr文字扫描,附带图像二值化处理,结果转换Excel,Pdf格式输出,支持Excel,Pdf内容读取,OCR带的是中文字库,但是识别率很低,请自行训练字库提高识别率
2023/8/1 23:04:21
47.42MB
Android
OCR
Excel
PDF
1
基于视觉信息的图像特征提取算法研究
自计算机视觉产生开始,视觉信息则自动成为其处理的对象。
纹理特征作为视觉信息的重要部分,成为图像特征提取的重点。
针对纹理特征提取中,传统LBP算法作为一种基于灰度的算法,仅仅局限对低分辨率图片,其识别率通常比较低的问题,提出一种基于小波变换的LBP算法。
该算法利用小波变换的局部特性、方向性和多方向性等特点,并结合LBP算法自身具有的旋转不变形、灰度不变形等特点,从而通过小波变换对高分辨率图片的分解,再通过局部二值模式的优势,从而实现对图像纹理特征的提取。
最后通过MATLAB软件编程与ORL数据库的对比测试,改进算法的识别率明显优于传统LBP算法。
2023/7/30 13:38:49
730KB
视信息;
LBP算法;
小波变换;
ORL;
1
使用OpenCV人头检测
一个应用于公交、汽车、车站商场的人头检测程序,检测出人头进出数量。
输入一幅图片,通过计算指定入口区域的HIST结果,判断是否有人进入。
可同时检测2人进入或出去。
一种基于随机Hough变换(RHT)的人头检测方法。
根据人头部轮廓近圆的特征,采用Canny算子提取图像边缘,得到目标轮廓。
利用RHT算法对独立的曲线进行圆检测,并对人头进行标识。
实验结果表明,与现有方法相比,该方法的识别率较高、速度较快、适用范围较广。
2023/7/25 4:39:41
170KB
OpenCV
人头
1
指静脉识别,keras,CNN
用于指静脉识别,Python语言,keras架构,CNN卷积神经网络,识别率可以达到97%。
禁止转载。
2023/7/17 1:28:34
5KB
指静脉识别
keras
CNN
1
基于ABC优化MVDR的语音情感识别研究
语音情感特征的提取和选择是语音情感识别的关键问题,针对线性预测(LP)模型在语音情感谱包络方面存在的不足。
本论文提出了最小方差无失真响应(MVDR)谱方法来进行语音情感特征的提取;
并通过人工蜂群(ABC)算法找到最优语音情感特征子集,消除特征冗余信息;
利用径向基函数(RBF)神经网络对CASIA汉语情感语料库中的4种情感语音即生气、平静、高兴、害怕进行实验识别。
实验结果表明,该方法比线性预测法有更高的识别率和更好的鲁棒性。
2023/7/10 3:38:29
653KB
最小方差无失真响应;
人工蜂群算法;
语言情感识别;
线性预测
1
基于MATLAB的一维条码识别系统
基于MATLAB的一维码识别系统,对损坏的条码图像时执行光电软仿真,识别率很高。
2023/7/5 9:14:16
182KB
MATLAB
条形码
图像处理
1
共 105 条记录
首页
上一页
下一页
尾页
钉钉无人值守自动打卡脚本 永不迟到的神器 安卓和苹果教程
New!
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03
15KB
钉钉
钉钉打卡
个人信息
点我去登录or注册
|
微信登录
一言
热门下载
双系统双频伪距单点定位程序
Docker构建tomcat镜像jdk1.8+tomcat9.zip
中科院考博英语2009-2018年试题及答案解析(十五套436面).pdf
飘逸传世引擎源代码
CNS2_CN_VW_P0095D_0332.7z
几何画板课件350套.zip
KEPServerEXV6.7.zip
vue项目demo(asp.netmvc5+vue2.5)
高光谱和LiDAR多模态遥感图像分类数据集
ENVI去云补丁Haze_tool文件及其使用说明和安装方法
新升级版TP5商城小程序源码+公众号版+h5一整套源码V3.zip
吉利新金刚2016款车机导航系统
ABAQUS金属非稳态和稳态切削过程的模拟分析_张东进.pdf
R9390系列BIOS修改和风扇调速工具
HTML5+CSS3中文参考手册(3手册)chm版中文参考手册打包
最新下载
VisualStudio实现TCpsocket异步通信,客户端和服务器端
学生作业管理系统,h5管理界面
全球海洋声速剖面获取软件
vtcp10使用Demo(含客户端、服务器端)
PID控制电机以及详细的PID算法公式
如何将CST微带模型导入AltiumDesigner绘制PCB制板
二叉树的C语言实现,实现二叉树基本功能
mips五级流水线带转发带汇编代码带二进制文件带使用说明
H12-221.pdf
网络设备台账(电脑、服务器、交换机、路由器、电话).xlsx
屈婉玲算法与设计及答案
cocos2d搓牌实例-lua代码(完美运行安卓和ios,解决ios崩溃问题)
按字母选择城市html+js代码
列出2005-12-24日从NorthPole出发的所有航班xquery
术语表:创建动画的终端演示文稿。导出为SVG,动画GIF或HTML+CSS-源码
其他资源
area2019.sql
Proteus仿真:基于查询方式的51定时器【成功】.rar
MATLAB源码集锦-最小生成树Prim算法代码
UML——BBS范畴模型
imdb10000.csv
抖音上特别火的照片变成TXT文档软件
udemy-react:使用CodeSandbox创建-源码
GoldenGate12c(ogg12c)一对多同步案例
MFC学生信息管理系统2018版
cs5463电能功率丈量法度圭表标准
ResearchMethodsforBusinessStudents,6thEdition,Saunders.pdf
stm32f103c8t6数据手册
假造机能做假造的交换机路由器的配置
contiki移植到stm32f103
CTex参考书
微机课程设计射击的模拟设计
OCControlEmpty(加载动画-空白页).zip
基于c语言的图形图像处置源代码残缺可实施工程
计算机通信网PPT教程
veriloghdl语言简易十进制计算器