以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。
1
为了解决一部分童鞋的疑惑,训练时候的各个参数是否正常。
今天又重新训了一次,截取前200次迭代日志。
方便大家参考对照。
2025/3/21 12:31:25 628KB YOLOv3 训练日志 参数分析
1
头条新闻文本分类数据集,包括11个类别,近50万条数据,文本内容为新闻标题+提取的关键词,分为训练数据和验证数据两个文件
1
Houston 2013数据集是一个结合了高光谱成像(HSI)与激光雷达(LiDAR)技术的数据集,主要用于遥感与地理信息系统研究领域。
该数据集针对地理信息的精确分析,包含了丰富的空间维度信息和光谱维度信息,使得它在地表覆盖分类、城市环境监测、农业遥感等多个领域具有重要的研究价值。


具体来说,高光谱成像技术能够在连续的光谱波段范围内获取地物的光谱信息,HSI数据集因而包含了成千上万的光谱波段,能够反映出地物在不同波长下的反射特性。
这些信息对于识别和分类不同的地物类型,如植被、水体、人造地物等具有重要意义。


另一方面,激光雷达技术通过发射激光脉冲并测量反射回来的信号来获得地表的高精度三维结构信息。
LiDAR数据集通常包括地物的高度信息、形状细节以及地表粗糙度等特征,这些信息对于地形分析、建筑物建模以及树木高度测量等方面至关重要。


Houston 2013数据集将HSI与LiDAR数据集分别划分为测试集和训练集,这样的划分可以用于开发和评估地表分类和遥感影像解译算法。
在遥感影像解译中,测试集用于验证算法的准确性,而训练集则用于训练分类器或机器学习模型,使得模型能够学习如何区分不同的地物类别。


该数据集的文件名称列表揭示了数据集的结构,其中HSI_TeSet.mat和HSI_TrSet.mat分别代表了高光谱成像数据集的测试集和训练集,LiDAR_TeSet.mat和LiDAR_TrSet.mat分别代表了激光雷达数据集的测试集和训练集。
TeLabel.mat和TrLabel.mat则可能包含了对应测试集和训练集的标签信息,即每一块地物的具体类别标签。


在处理这些数据集时,研究者需要熟悉遥感影像分析的常用工具和方法,例如使用ENVI、ArcGIS、ERDAS Imagine等软件对HSI数据进行预处理和分析,以及使用Terrascan、LIDAR360等软件对LiDAR数据进行点云处理。
除此之外,深度学习方法,特别是卷积神经网络(CNN)在处理HSI数据中也显示出强大的能力,它可以自动提取和学习光谱特征,对于提高分类精度具有显著效果。


Houston 2013数据集通过提供两种不同的遥感技术所获得的综合数据集,为遥感领域的研究者提供了一个宝贵的实验平台,使得他们可以在此基础上开发和测试新的地表分类算法和模型,进而推动遥感技术在环境监测与分析中的应用与发展。
2025/3/18 14:41:47 13.69MB 数据集 LIDAR数据
1
未来教育二级C无纸化考试模拟软件破解版是一款非常实用的全国计算机等级考试题库软件,使用能够帮助用户模拟真实的考试,包括测验评析、错题重做、题库大全和同步练习等,集训练、测试、考试于一体,让提前熟悉考试,做到心中有数,最快的通过考试,全国计算机等级考试二级C(以下简称C)无纸化考试测试考生在Windows的环境下对标准C的编程语言的使用能力。
本次小编带来的是未来教育二级C无纸化考试模拟软件最新破解版,需要的朋友不要错过了!
2025/3/15 6:56:15 78.81MB 程序
1
基于GPT2模型的5言和7言诗歌生成的测试项目,使用pytorch框架,里面包含了几万首古诗和已经编好码的字典和数据集,由于模型太大,上传不便,大家自己跑一下训练代码就可以了,跑了20轮之后的模型,目测效果还可以,至少我本人是写不出来这些诗歌了,哈哈
2025/3/14 19:52:11 27.24MB GPT2 pytorch 深度学习
1
resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5速度快,准确率高,参数不多50层残差网络模型,权重训练自ImageNet该模型在Theano和TensorFlow后端均可使用,并接受channels_first和channels_last两种输入维度顺序模型的默认输入尺寸:224x224
2025/3/13 0:22:32 90.27MB resnet50 notop tf weights
1
Word2Vec模型word2vec-google-news-300。
在GoogleNews数据集上训练完成的Word2Vec模型,覆盖了大约300万的词汇和短语。
该模型是利用了整个GoogleNews大约1000亿个词的语料训练而成!由于文件太大,将压缩包分成了10个部分。
1
其他版本可以去我空间查看。
CIFAR-10数据集由10个类中的60000个32x32彩色图像组成,每个类有6000个图像。
有50000个训练图像和10000个测试图像。
数据集分为五个训练批次和一个测试批次,每个批次有10000个图像。
测试批次包含来自每个类别的1000个随机选择的图像。
训练批次以随机顺序包含剩余图像,但是一些训练批次可能包含来自一个类别的更多图像而不是另一个类别。
在他们之间,培训批次包含来自每个班级的5000个图像。
2025/3/10 16:42:18 162.18MB cifar 神经网络 机器学习 图像处理
1
转换gta5到cityscapes可训练的20类
2025/3/9 16:17:39 3KB label
1
共 1000 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡