本语料库由复旦大学李荣陆提供。
train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。
下载后可以自己重新切分数据,也可以直接用。
免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ密码:dq9m使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2023/11/3 21:56:21 106.17MB 中文文本分类 数据集
1
GENIA语料库是为GENIA项目编写并标注的最初的生物医学文献集合。
这个语料库是为了发展和评估分子生物学信息检索及文本挖掘系统而创建的。
这个语料库包含1999条Medline的摘要,这些摘要是由PubMed按照human、bloodcells以及transcriptionfactors三个医学主题词(medicalsubjectheadingterms)为搜索条件搜索到的。
这个语料库已经被按照不同级别的语言信息、语义信息进行标注。
2023/10/3 21:18:28 4.55MB 实体识别
1
rost关键词集,包括历史学1万词、图书情报类1万词、心理学类1万词、法律类2万词、新闻传播类9000、计算机类10万词
2023/9/24 18:03:40 669KB Rost 语料库 关键词集
1
网易新闻语料库文本分类自然语言处理网上基本找不到哦~~
1
这个链接是训练集,测试集请见我的资源本语料库由复旦大学李荣陆提供。
test_corpus.rar为测试语料,共9833篇文档;
train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
文件较大(训练测试各50多兆),下载时请耐心等待。
2023/8/25 4:36:57 50.38MB 中文文本分类 文本分类语料
1
通过对语音数据进行特征提取,运用SVM识别算法,实现语音信号的6种情感的识别。
语料库选自CASIA汉语情感语料库,特征集选取基因频率、时长、共振峰、MFCC等。
2023/8/19 1:03:27 215.47MB SVM 语音识别 情感识别
1
美国当代英语语料库(CorpusofContemporaryAmericanEnglish,简称COCA),用计算机统计英语单词词频并排序,已包含5.6亿字的文本,是目前最大的免费英语语料库。
1990年至2017年,COCA以每年2000万字的速度更新扩充,以保证语料库内容的时效性。
其语料均衡分布在口语、小说、杂志、报纸以及学术文章五类文体中,被认为是用来观察美国英语当前发展变化的最合适的英语语料库,也是广大英语爱好者的学习宝库。
2023/8/11 6:18:12 1.48MB COCA 英语 20000
1
自然语言处理,对联系统,语料库为全唐诗,采用马尔科夫语言模型
2023/8/10 12:39:55 8.35MB 对联系统
1
LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库。
起先建立时,它是作为英国经社研究委员会资助项目ContrastingTenseandAspectinEnglishandChinese的部分成果。
肖忠华最初的设想是要将其建成同FLOB和FROWN对应的现代汉语语料库。
筹建这样的一个语料库的另一个动因是:尽管已经有很多汉语语料库存在,但却没有一个完全免费对公众开放的平衡的汉语语料库
2023/8/8 2:39:28 6.34MB 语料库
1
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。
由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。
使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。
2023/7/28 17:38:49 234B wiki中文
1
共 116 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡