上传者: github_36326955
|
上传时间:2023/4/21 17:35:29
|
文件大小:51.14MB
|
文件类型:rar
中文文天职类语料(复旦)-测试集下载
这个链接是测试集,熬炼集请见我的资源本语料库由复旦大学李荣陆提供。
test_corpus.rar为测试语料,共9833篇文档;
train_corpus.rar为熬炼语料,共9804篇文档,两个预料各分为20个相同种别。
熬炼语料以及测试语料底子依据1:1的比例来松散。
使历时尽量即便注明来源(复旦大学盘算机信息与本领系国内数据库中间做作语言处置小组)。
文件较大(熬炼测试各50多兆),下载时请耐心期待。