基于词典的最大正向/方向匹配算法的JAVA实现,附带Demo窗体和人民日报语料库。
2025/1/30 11:02:08 254KB 分词 Java
1
序列到序列(Seq2Seq)模型已被广泛用于会话领域的响应生成。
但是,不同对话方案的要求是不同的。
例如,客户服务要求所生成的响应是特定且准确的,而聊天机器人更喜欢多样化的响应以吸引不同的用户。
通过使用一般平均可能性作为优化标准,当前的Seq2Seq模型无法满足这些多样化的要求。
结果,它通常会生成安全且平常的响应,例如“我不知道”。
在本文中,我们针对不同的对话场景提出了两个针对Seq2Seq量身定制的优化标准,即针对特定需求场景的最大生成可能性和针对不同需求场景的条件风险价值。
在Ubuntu对话语料库(Ubuntu服务场景)和中文微博数据集(社交聊天机器人场景)上的实验结果表明,我们提出的模型不仅可以满足不同场景的各种要求,而且在衡量指标上均优于传统的Seq2Seq模型。
基础评估和人工评估。
2025/1/7 9:50:33 476KB 研究论文
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2025/1/3 19:40:18 45.53MB 平行语料库
1
中文语料的停用词txt文档,取自复旦大学中文语料库,文件很小
2025/1/3 18:28:27 3KB 停用词
1
此资源是商城评论语料库58万条,可用于分析该评论语料库采集自京东商城,包含电脑评论、手机评论、图书评论、服装评论等19个不同种类的消费者评论,共有58万条评论记录。
数据文件中每条评论记录占一行,每条评论句后面给出类别标注,分隔符为"\t"。
该语料库是研究评论文本较好的训练数据集。
2025/1/2 13:53:43 41.27MB 料库
1
CTB6汉语分词语料库,可以拿来做分词任务。
















































































2024/12/10 7:05:37 6.3MB 自然语言处理 分词 语料库
1
OntoNotes5.0的中文部分包括250K字的新闻专线数据,270K字的广播新闻和170K的广播会话。
新闻专线的数据来自中国树库5.0。
250K包括100K的新华新闻数据(chtb_001.fid到chtb_325.fid)和来自Sinorama新闻杂志的150K数据(chtb_1001.fid到chtb_1078.fid)。
广播新闻数据是来自TDT4的274K字,并且是从LDC为自动内容提取(ACE)程序注释的数据中选择的。
已将这些文件的编号chtb_2000.fid分配给chtb_3145.fid。
广播对话数据是170K字,取自LDC的GALE数据。
50K的原始中文数据也用英文注释,另外55K的中文数据代表原始英语广播对话翻译成中文。
Web数据包括215K令牌,其中15K来自P2.5评估,86K来自Dev09数据。
此外,110K的Web数据由40K并行中文源数据和70K并行英文原始数据组成。
电话会话语料库包括大约100K的中文CallHome数据,用解析,命题,名称和共同参考信息注释。
2024/12/4 15:47:12 67.81MB conll Ontonotes
1
本语料库由复旦大学李荣陆提供。
训练和测试两个语料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2024/11/18 15:51:57 109.68MB 文本分类
1
Alice问答系统的aiml格式对话语料,最新语料大小7.8MB(不同于之前的官方语料库仅有1~2MB),格式为aiml格式,直接可以供alicebot训练使用。
2024/11/8 8:54:48 7.87MB alice 数据集 语料库 对话机器人
1
机器人对话语料库,苦苦收集而来,希望可以帮助大家,谢谢支持
2024/11/1 1:16:47 106.16MB 图灵对话 机器人对话 语料库 聊天语料
1
共 116 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡