CTB6汉语分词语料库,可以拿来做分词任务。
















































































2024/12/10 7:05:37 6.3MB 自然语言处理 分词 语料库
1
OntoNotes5.0的中文部分包括250K字的新闻专线数据,270K字的广播新闻和170K的广播会话。
新闻专线的数据来自中国树库5.0。
250K包括100K的新华新闻数据(chtb_001.fid到chtb_325.fid)和来自Sinorama新闻杂志的150K数据(chtb_1001.fid到chtb_1078.fid)。
广播新闻数据是来自TDT4的274K字,并且是从LDC为自动内容提取(ACE)程序注释的数据中选择的。
已将这些文件的编号chtb_2000.fid分配给chtb_3145.fid。
广播对话数据是170K字,取自LDC的GALE数据。
50K的原始中文数据也用英文注释,另外55K的中文数据代表原始英语广播对话翻译成中文。
Web数据包括215K令牌,其中15K来自P2.5评估,86K来自Dev09数据。
此外,110K的Web数据由40K并行中文源数据和70K并行英文原始数据组成。
电话会话语料库包括大约100K的中文CallHome数据,用解析,命题,名称和共同参考信息注释。
2024/12/4 15:47:12 67.81MB conll Ontonotes
1
本语料库由复旦大学李荣陆提供。
训练和测试两个语料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2024/11/18 15:51:57 109.68MB 文本分类
1
Alice问答系统的aiml格式对话语料,最新语料大小7.8MB(不同于之前的官方语料库仅有1~2MB),格式为aiml格式,直接可以供alicebot训练使用。
2024/11/8 8:54:48 7.87MB alice 数据集 语料库 对话机器人
1
机器人对话语料库,苦苦收集而来,希望可以帮助大家,谢谢支持
2024/11/1 1:16:47 106.16MB 图灵对话 机器人对话 语料库 聊天语料
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2024/9/17 4:16:32 45.51MB 语料库 中英 平行语料库
1
数据挖掘文本分类语料库(中文)-李荣陆老师的一部分资料
2024/9/12 19:04:03 3.82MB 分类语料
1
7000多条酒店评论数据,5000多条正向评论,2000多条负向评论数据字段:Label:1表示正向评论,0表示负向评论Review:评论内容数据格式:label,review
1
中国学习者英语语料库
2024/8/26 0:15:18 2.03MB 中国学习者英语语料库
1
包含情感词(积极,消极,程度词,主张词),情感词典(大连理工,HowNet),中文情感挖掘酒店评论语料
1
共 101 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡