SougoCS数据集,内含11类搜狐新闻文本,近10万条。
搜狗提供的数据为未分类的XML格式。
此资源已经将XML解析并分类完毕,方便使用。
2024/5/31 6:22:46 94.29MB NLP 自然语言处理 文本分类 搜狗
1
复旦大学中文语料分类数据3个子文档一共有19666个文档是很好的分类语料库
2024/3/21 19:06:57 105.02MB wenbenfenlei
1
本语料库由复旦大学李荣陆提供。
train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。
下载后可以自己重新切分数据,也可以直接用。
免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ密码:dq9m使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2023/11/3 21:56:21 106.17MB 中文文本分类 数据集
1
新闻栏目中文文本分类,新闻栏目一共有:体育5000时政5000房产5000家居5000财经5000时尚5000科技5000教育5000娱乐5000游戏5000每个新闻栏目拥有5000条新闻,通过对新闻内容作为样本训练模型,使得该模型能够预测出该条新闻所属的栏目。
2023/8/9 15:39:56 66.03MB 文本分类数据集
1
由复旦大学李荣陆提供。
answer.rar为测试语料,共9833篇文档;
train.rar为训练语料,共9804篇文档,分为20个类别。
训练语料和测试语料基本按照1:1的比例来划分。
收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然言语处理小组)。
2022/10/26 16:15:12 103.28MB 数据集 中文语料库
1
文本挖掘文本分类数据集进行文本挖掘,文本分类聚类等研讨的可用的数据集
2017/8/3 20:03:29 17.4MB 文本挖掘 文本分类 数据集
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡