使用R语言中的jiebaR包,对中文文本进行分词,求词频,做词云图并进行LDA主题建模。
2024/1/23 12:15:36 14KB jiebaR,LDA
1
训练集
2024/1/20 21:02:01 144.1MB 文本分类
1
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。
源码为java实现
2023/11/20 2:12:44 9KB kmeans 中文 文本聚类 tf
1
软件主要功能:1.批量转换简体中文文件名为日文汉字文件名(非繁体中文)2.批量转换简体中文文本为日文汉字文本(非繁体中文)3.支持文件夹拖拽注:需要.NETFramework2.0支持
2023/11/11 6:51:16 31KB 简体转日文汉字
1
中文文本分类语料(复旦)-训练集和测试集这个链接是训练集,本语料库由复旦大学李荣陆提供。
test_corpus为测试语料,共9833篇文档;
train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
文件较大,下载时请耐心等待。
2023/11/10 13:33:38 101.81MB 文本分类 数据集 复旦 中文
1
实现文本分类的主要包括几个步骤文本分词处理,特征选择,特征权重计算,文本特征向量表示,基于训练文本的特征向量数据训练SVM模型,对于测试集进行特征向量表示代入训练得到的svm模型中进行预测分类,达到93%的准确率
2023/11/8 2:28:34 26.06MB 文本分类
1
本语料库由复旦大学李荣陆提供。
train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。
下载后可以自己重新切分数据,也可以直接用。
免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ密码:dq9m使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2023/11/3 21:56:21 106.17MB 中文文本分类 数据集
1
关于苏宁网站上的空调评论进行的数据分析,主要对中文文本进行各式各样的、全面的分析。
2023/10/27 11:26:25 617KB tfidf lda 词云图 nlp
1
基于内容的文本分类系统,使用libsvm进行分类。
2023/10/1 5:28:53 40.58MB svm 文本分类 中文分词 libsvm
1
AdobeAcrobatXPro是绿色版,有时在打开中文文本PDF时,总是提示需要需要”简体中文语言支持包”方可正确显示本页面。
2023/9/28 6:13:41 58.7MB 字体
1
共 42 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡