谭松波老师的评论语料资源gb2312,除了原始编码格式,还有UTF-8编码格式的,在这里一起分享给大家,还将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论,更加的方便大家使用
2024/6/4 7:30:38 9.88MB 谭松波 酒店评论语料
1
为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。
语料规模为10000篇。
语料从携程网上自动采集,并经过整理而成。
为了方便起见,语料被整理成4个子集:1.ChnSentiCorp-Htl-ba-2000:平衡语料,正负类各1000篇。
2.ChnSentiCorp-Htl-ba-4000:平衡语料,正负类各2000篇。
3.ChnSentiCorp-Htl-ba-6000:平衡语料,正负类各3000篇。
4.ChnSentiCorp-Htl-unba-10000:非平衡语料,正类为7000篇。
2024/3/24 6:03:01 3.81MB 酒店评价语料
1
https://blog.csdn.net/zzZ_CMing/article/details/89478436朴素贝叶斯算法做文本分类,用的是谭松波酒店语料。
2023/9/30 17:09:20 1.14MB bayes 文本分类 谭松波
1
为了赔偿国内在中文感情开掘方面的语料的匮乏,谭松波凑集收拾了一个较大规模的旅馆品评语料。
语料规模为10000篇。
语料从携程网上自动收集,并经由收拾而成。
为了便捷起见,语料被收拾成4个子集:1.ChnSentiCorp-Htl-ba-2000:失调语料,正负类各1000篇。
2.ChnSentiCorp-Htl-ba-4000:失调语料,正负类各2000篇。
3.ChnSentiCorp-Htl-ba-6000:失调语料,正负类各3000篇。
4.ChnSentiCorp-Htl-unba-10000:非失调语料,正类为7000篇。
2023/4/3 23:57:34 3.81MB 中文情感分析 酒店评论预料
1
语料规模为10000篇。
语料从携程网上自动收集,并经由收拾而成。
为了便捷起见,语料被收拾成4个子集:1.ChnSentiCorp-Htl-ba-2000:失调语料,正负类各1000篇。
2.ChnSentiCorp-Htl-ba-4000:失调语料,正负类各2000篇。
3.ChnSentiCorp-Htl-ba-6000:失调语料,正负类各3000篇。
4.ChnSentiCorp-Htl-unba-10000:非失调语料,正类为7000篇。
2023/3/22 5:31:52 9.88MB 情感分析 酒店评论 语料库
1
不要50分,只需3分。
谭松波-酒店评论语料-utf8,gb两种格式,一共10000条数据。
2015/4/23 5:48:16 9.88MB 谭松波 情感分析 酒店评论 语料
1
#语料库阐明------------------------------------------------------------------------##词典1、HowNet情感词典2、ntusd情感词典3、情感分析停用词表4、结巴分词自定义词典5、常用语词典,包括流行新词,网络流行词,手机词汇,粤语,潮语潮词、阿里巴巴-通讯产品词汇等##手机评论数据1、HTC手机评论,包括打分,共302篇1-52、魅族手机评论,包括打分,共529篇1-53、诺基亚手机评论,包括打分,共614篇1-54、OPPO手机评论,包括打分1-5,共553篇5、三星手机评论,包括打分1-5,共762篇6、中兴手机评论,包括打分1-5,共785篇7、摩托罗拉手机评论,包括打分1-5,共990篇8、整合:正面评论1084篇,负面评论524篇##淘宝商品评论数据1、正面评论一万篇,负面评论一万篇2、待预测的语料一万篇##2012微博情感分析数据共三个任务,数据集来自腾讯微博,每个话题1,000条,总约两万条微博1、观点句与非观点句的判别2、情感分类3、情感要素抽取##谭松波酒店评论语料正负样本不平衡,正样本7,000,负样本3000,共10,000.##酒店、服装、水果、平板、洗发水正负样本均5,000,总样本数50,000
2015/3/9 14:02:03 12.81MB 中文语料 情感分析 数据集
1
(含源码及报告)本程序分析了自2016年到2021年(外加)每年我国原油加工的产量,并且分析了2020年全国各地区原油加工量等,含饼状图,柱状图,折线图,数据在地图上显示。
运转本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运转。
文件含6个excel表,若干个csv文件以及一个名字为render的html文件(需要用浏览器打开),直观的数据处理部分是图片以及html文件,可在地图中显示,数据处理的是excel文件。
不懂可以扫文件中二维码在QQ里面问。
2022/9/30 16:31:44 29.75MB 爬虫 python 源码软件 开发语言
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡