LOB语料库创建时间:1970年代初创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学规模层级:100万词次基本情况:研究当代英国英语,与美国英语对比,使用了TAGIT系统,以统计方式建立换算几率矩阵,提高标注正确率。
TheLancaster-OsloBergenCorpus(LOB)wascompiledbyresearchersinLancaster,OsloandBergen.ItconsistsofonemillionwordsofBritishEnglishtextsfrom1961.Thetextsforthecorpusweresampledfrom15differenttextcategories.Eachtextisjustover2.000wordslong(longertextshavebeencutatthefirstsentenceboundaryafter2.000words)andthenumberoftextsineachcategoryvaries(seetablebelow).FurtherinformationaboutthetextscanbefoundintheLOBmanual(externallink).ThiscorpusistheBritishcounterpartoftheBrownCorpusofAmericanEnglish.whichcontainstextsprintedinthesameyearsothatcomparisonbetweenbothvarietiescouldbemade
2025/8/14 21:55:32 94.94MB LOB语料库 英语语料库
1
美国当代英语语料库COCA词频20000【包含Txt、Word、PDF】(完整)
1
中国学习者英语语料库
2024/8/26 0:15:18 2.03MB 中国学习者英语语料库
1
美国当代英语语料库COCA词频20000高频2W(完整)格式:pdf,word文档,txt,excel文档
2023/11/29 1:47:13 15.76MB 英语 单词 coca 词频表
1
美国当代英语语料库(CorpusofContemporaryAmericanEnglish,简称COCA),用计算机统计英语单词词频并排序,已包含5.6亿字的文本,是目前最大的免费英语语料库。
1990年至2017年,COCA以每年2000万字的速度更新扩充,以保证语料库内容的时效性。
其语料均衡分布在口语、小说、杂志、报纸以及学术文章五类文体中,被认为是用来观察美国英语当前发展变化的最合适的英语语料库,也是广大英语爱好者的学习宝库。
2023/8/11 6:18:12 1.48MB COCA 英语 20000
1
基于语音的性别识别基于语音的性别识别,使用:免费的ST美国英语语料库数据集(SLR45)梅尔频率倒谱系数(MFCC)高斯混合模型(GMM)数据集可以在上找到免费的ST美国英语语料库数据集(SLR45)。
它是提供的免费的美国英语语料库,其中包含10位说话者(5位女性和5位男性)的讲话。
每个说话者大约有350种话语。
理论语音特征提取此处使用梅尔频率倒谱系数(MFCC),因为它们可在说话者验证中提供最佳结果。
MFCC通常如下得出:进行信号(窗口摘要)的傅立叶变换。
使用三角形重叠窗口,将以上获得的光谱的功率映射到mel刻度上。
记录每个梅尔频率下的功率对数。
2023/5/29 20:06:48 18.1MB data-science machine-learning scikit-learn voice
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡