用于HMM中文分词训练,代码可以参见:https://blog.csdn.net/qq_38593211/article/details/81637029
2023/11/17 22:16:09 16.62MB NLP NER
1
中文文本分类语料(复旦)-训练集和测试集这个链接是训练集,本语料库由复旦大学李荣陆提供。
test_corpus为测试语料,共9833篇文档;
train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
文件较大,下载时请耐心等待。
2023/11/10 13:33:38 101.81MB 文本分类 数据集 复旦 中文
1
图灵机器人知识库(语料库),文件为Excel文件对话模板,用户按需下载即可。














2023/11/10 11:21:09 851KB 图灵机器人
1
使用卷积神经网络,对问题进行特征提取,匹配语料库中最优问题并给出回答
2023/11/8 8:20:25 2.33MB CNN QA
1
实现文本分类的主要包括几个步骤文本分词处理,特征选择,特征权重计算,文本特征向量表示,基于训练文本的特征向量数据训练SVM模型,对于测试集进行特征向量表示代入训练得到的svm模型中进行预测分类,达到93%的准确率
2023/11/8 2:28:34 26.06MB 文本分类
1
本语料库由复旦大学李荣陆提供。
train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。
下载后可以自己重新切分数据,也可以直接用。
免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ密码:dq9m使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2023/11/3 21:56:21 106.17MB 中文文本分类 数据集
1
GENIA语料库是为GENIA项目编写并标注的最初的生物医学文献集合。
这个语料库是为了发展和评估分子生物学信息检索及文本挖掘系统而创建的。
这个语料库包含1999条Medline的摘要,这些摘要是由PubMed按照human、bloodcells以及transcriptionfactors三个医学主题词(medicalsubjectheadingterms)为搜索条件搜索到的。
这个语料库已经被按照不同级别的语言信息、语义信息进行标注。
2023/10/3 21:18:28 4.55MB 实体识别
1
rost关键词集,包括历史学1万词、图书情报类1万词、心理学类1万词、法律类2万词、新闻传播类9000、计算机类10万词
2023/9/24 18:03:40 669KB Rost 语料库 关键词集
1
网易新闻语料库文本分类自然语言处理网上基本找不到哦~~
1
这个链接是训练集,测试集请见我的资源本语料库由复旦大学李荣陆提供。
test_corpus.rar为测试语料,共9833篇文档;
train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
文件较大(训练测试各50多兆),下载时请耐心等待。
2023/8/25 4:36:57 50.38MB 中文文本分类 文本分类语料
1
共 121 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡