搜索【文本分类】的结果-好快吧下载

NLP文本分类语料库（复旦）训练集

由复旦大学李荣陆提供。
收集工作花费了不少人力和物力，所以请大家在使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然言语处理小组）。
train.zip为训练语料，共9804篇文档，分为20个类别。
answer.zip为训练语料，共9833篇文档，同为20个类别。
训练语料与测试语料基本按照1:1的比例来划分

2018/4/14 2:19:18 52.56MB NLP 文本分类 语料库 训练集

1

自然言语处理数据集——初中数学学科

提供高中数学学科的知识数据集，包含6661个样本和706个实体，提供了基于该数据集的实体关系数据库（一共12种关系，11250个实体关系对）。
该数据集可用于基于高中数学学科的知识图谱的构建，包含命名实体识别、实体关系抽取、文本分类等任务。

2017/8/3 11:49:43 502KB 自然语言处理 初中数学学科 深度学习 命名实体识别

1

LCSTS高质量中文短文本摘要数据集

文档中包含网盘的地址，数据共319MNLP方向文本摘要，文本分类，等方向可采取！TheLCSTSdatasetincludestwoparts:/DATA:1.PARTI:isthemaincontentsofLCSTSthatcontains2,400,591(shorttext,summary)pairs.Itcanbeusedtotrainsupervisedlearningmodelsforsummarygeneration.2.PARTII:contains10,666humanlabled(shorttext,summary)pairswhichcanbeusedtotrainclassifiertofilterthenoisesofthePARTI.3.PARTIII:contains1,106(shorttext,summary)pairs,thispartislabledby3personswiththesamelabels.Thesepairswithscore3,4and5canbeusedastestsetforevaluatingsummarygenerationsystems./Result:1.sumary.generated.char.context.txt:containsthesummarygeneratedbyusingRNN+contextonthecharacterbasedinput.2.sumary.generated.char.nocontext.txt:containsthesummarygeneratedbyusingRNN+nocontextonthecharacterbasedinput.3.sumary.generated.word.context.txt:containsthesummarygeneratedbyusingRNN+contextonthewordbasedinput.4.sumary.generated.word.nocontext.txt:containsthesummarygeneratedbyusingRNN+nocontextonthewordbasedinput.5.weibo.txt:containstheweiboofthetestset.6.sumary.human:containsthesumariescorrespondingto'weibo.txt'writtenbyhuman.Thispartisthetestsetofthepaper.7.rouge.char_context.txt:therougemetriconsumary.generated.char.context8.rouge.char_nocontext.txt:therougemetriconsumary.generated.char.nocontext9.rouge.word_context.txt:therougemetriconsumary.generated.word.context10.rouge.word_nocontext.txt:therougemetriconsumary.generated.word.nocontext

2018/10/23 6:40:09 66B nlp

1

文本分类之词频统计（分词、词干提取、去停用词、计算词频，有界面）

次要是读取文本，然后进行分词、词干提取、去停用词、计算词频，有界面，很实用

2017/4/26 5:41:42 70KB 词频计算

1

复旦大学中文文本分类数据集-训练+测试

由复旦大学李荣陆提供。
answer.rar为测试语料，共9833篇文档；
train.rar为训练语料，共9804篇文档，分为20个类别。
训练语料和测试语料基本按照1:1的比例来划分。
收集工作花费了不少人力和物力，所以请大家在使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然言语处理小组）。

2022/10/26 16:15:12 103.28MB 数据集 中文语料库

1

基于深度学习的文本分类技术研究进展

文本分类技术经历了从专家系统到机器学习再到深度学习的发展过程。
在20世纪80年代以前，基于规则系统的文本分类方法需要领域专家定义一系列分类规则，通过规则婚配判断文本类别。

2021/2/22 19:33:17 1.34MB 深度学习 文本分类

1

20NEWSGROUP

文本挖掘文本分类数据集进行文本挖掘,文本分类聚类等研讨的可用的数据集

2017/8/3 20:03:29 17.4MB 文本挖掘 文本分类 数据集

1

TF*IDFjava实现

该文档是文本分类中权重计算的算法，即TF*idf算法的源代码，希望对您有所协助

2019/1/11 21:23:35 42KB 文本权重计算

1

NLP小白入门——超全中文文本分类零碎（含训练及测试数据集）

NLP小白入门——超全中文文本分类零碎（trainset&testset+stopword*4+word2vec+TF-IDF+NaiveBayes）

2021/2/7 13:55:56 13.63MB 自然语言处理

1

中文京东商品评论数据集

中文京东商品评论数据集，分为正负两类，共4000个，可用做文本分类尝试

2015/5/9 3:42:52 741KB 文本分类

1

钉钉无人值守自动打卡脚本永不迟到的神器安卓和苹果教程 New!

在日常工作中，钉钉打卡成了我生活中不可或缺的一部分。然而，有时候这个看似简单的任务却给我带来了不少烦恼。每天早晚，我总是得牢记打开钉钉应用，点击"工作台"，再找到"考勤打卡"进行签到。有时候因为工作忙碌，会忘记打卡，导致考勤异常，影响当月的工作评价。而且，由于我使用的是苹果手机，有时候系统更新后，钉钉的某些功能会出现异常，使得打卡变得更加麻烦。另外，我的家人使用的是安卓手机，他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说，每次打卡都是一次挑战。他们总是担心自己会操作失误，导致打卡失败。为了解决这些烦恼，我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习，我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。

2024-04-09 15:03 15KB 钉钉 钉钉打卡

个人信息

一言

热门下载

最新下载

其他资源