含有43万条非重复语料
2023/12/3 16:18:41 4.46MB 中分文分词 词典
1
新闻分类语料,9个类别财经,教育,军事,科技,政治等按新闻标签爬取的。
2023/11/24 4:52:46 18.09MB svm分类语料
1
整合当前可以找到的NER语料集,并把格式统一化,可以直接训练。
2023/11/22 14:04:05 23.02MB NLP corpus 语料集
1
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
2023/11/12 22:21:43 7.84MB 机器翻译
1
中文文本分类语料(复旦)-训练集和测试集这个链接是训练集,本语料库由复旦大学李荣陆提供。
test_corpus为测试语料,共9833篇文档;
train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
文件较大,下载时请耐心等待。
2023/11/10 13:33:38 101.81MB 文本分类 数据集 复旦 中文
1
处理好的人民日报语料,用于命名实体识别,两个文件分别为字符集和词语级
2023/10/24 9:19:41 4.53MB 自然语言处理 命名实体识别
1
该语料主要用于中文微博中的情感句识别、情感倾向性分析和情感要素抽取。
情感分析资源大全:http://blog.csdn.net/qq280929090/article/details/70838025
2023/10/12 22:37:30 3.02MB 情感分析
1
该语料主要用于识别微博观点句中的评价对象和极性。
训练数据由两个微博主题组成,每个主题各一百条,内含标注及数据说明。
情感分析资源大全:http://blog.csdn.net/qq280929090/article/details/70838025
2023/10/4 17:14:13 1.01MB 情感分析
1
https://blog.csdn.net/zzZ_CMing/article/details/89478436朴素贝叶斯算法做文本分类,用的是谭松波酒店语料。
2023/9/30 17:09:20 1.14MB bayes 文本分类 谭松波
1
这是本人自己爬取的今日头条新闻数据。
包括了6个类别:军事,体育,娱乐,时尚,汽车,游戏。
每个类别有2000左右的数据。
包含有新闻的题目,正文。
还有一些类别中包含了新闻的发布时间,新闻来源等信息。
2023/9/14 19:21:15 16.56MB 中文新闻 语料库
1
共 109 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡