中文情感分析语料库,包含酒店、服装、水果、平板、洗发水等5个领域的评价数据,每个领域各包含5000条正面和负面评价,数据抓取于携程网和京东,仅供科研学习之用,欢迎下载使用!
2024/5/18 20:30:47 2.21MB 语料库
1
京东商城华为荣耀8的手机评论数据,已人工标注好类别,可以作为文本情感分析的语料库。
2024/5/18 10:46:49 436KB 文档
1
该评论语料库采集自京东商城,包含电脑评论、手机评论、图书评论、服装评论等19个不同种类的消费者评论,共有58万条评论记录。
数据文件中每条评论记录占一行,每条评论句后面给出类别标注,分隔符为"\t"。
该语料库是研究评论文本较好的训练数据集。
2024/5/11 1:12:30 41.27MB 评论语料库
1
已经标记号label的中文命名实体识别的语料库,采用BIM标志形式。
包括人名(PERSON)、地点(LOCATION)、时间(TIME)及机构名(ORGANIZATION)。
2024/5/10 1:36:01 17.29MB nlp NER 命名实体识别
1
汉语语料库,包含9000多个文本,涵盖新闻、论文、散文、小说等多种类型的文本,经过了分词和词性标注的精加工。
2024/4/27 17:48:12 31.68MB 语料库
1
解决nltk安装punkt等语料库时报错的问题;
把下载好的语料包punkt.zip解压到nltk_data/tokenizers/punkt中
2024/4/12 10:36:57 13.07MB 自然语言处理
1
为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。
语料规模为10000篇。
语料从携程网上自动采集,并经过整理而成。
为了方便起见,语料被整理成4个子集:1.ChnSentiCorp-Htl-ba-2000:平衡语料,正负类各1000篇。
2.ChnSentiCorp-Htl-ba-4000:平衡语料,正负类各2000篇。
3.ChnSentiCorp-Htl-ba-6000:平衡语料,正负类各3000篇。
4.ChnSentiCorp-Htl-unba-10000:非平衡语料,正类为7000篇。
2024/3/24 6:03:01 3.81MB 酒店评价语料
1
复旦大学中文语料分类数据3个子文档一共有19666个文档是很好的分类语料库
2024/3/21 19:06:57 105.02MB wenbenfenlei
1
 信息增益是文本分类中一种有效的特征项选择方法,针对垃圾邮件过滤中的特征项选择问题,提出了一种改进的信息增益方法提取特征词,并采用了最小风险贝叶斯的决策方法,最后在英文语料库上进行实验,实验结果表明改进后的方法降低了过滤器对合法邮件的误判。
1
人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料
2024/3/11 1:22:30 2.12MB 语料库 人民日报 中文分词 语义
1
共 116 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡