原文件为zhwiki-latest-pages-articles.xml.bz2,大小为1.7G,最新时间为19年7月下载,转为txt文本,繁转简,分词,gensim训练后的model文件
2025/1/9 3:53:47 15.28MB Word2Vec 训练模型文件 zhwiki-latest-pa
1
中文语料的停用词txt文档,取自复旦大学中文语料库,文件很小
2025/1/3 18:28:27 3KB 停用词
1
文本分类训练与测试语料,详情见博客《《自然语言处理实战入门》文本分类----使用词向量与SVM进行文本分类》:https://season.blog.csdn.net/article/details/113798565
2025/1/1 20:44:32 95.36MB NLP 文本分类
1
本资源是基于Android的智能聊天机器人的源代码。
它的运行逻辑就是将用户输入的文字,调用复旦nlp算法分词后,得到主谓宾三个关键词,然后分别按照主谓宾的的顺序与数据库(SQLite)中的三个表匹配,匹配得到一个id,然后根据这个id到语料表中找到对应的回答,反馈给用户。
它有学习功能,即用户可教它说话,其原理也使通过分词,将分词结果存入到主谓宾三个表中。
数据库在assets文件夹中。
若有其它疑问可与我私信。
2024/12/15 7:41:42 4.12MB Android SQLite数据库 智能聊天
1
本语料库由复旦大学李荣陆提供。
训练和测试两个语料各分为20个相同类别。
训练语料和测试语料基本按照1:1的比例来划分。
使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2024/11/18 15:51:57 109.68MB 文本分类
1
Alice问答系统的aiml格式对话语料,最新语料大小7.8MB(不同于之前的官方语料库仅有1~2MB),格式为aiml格式,直接可以供alicebot训练使用。
2024/11/8 8:54:48 7.87MB alice 数据集 语料库 对话机器人
1
数据来源于中文维基百科,利用gensim进行数据抽取,再经过繁体字转换成简体字,得到纯净的文本语料,可用于词向量训练。
2024/11/5 8:52:11 146.03MB 维基语料 词向量语料
1
使用glove预训练词向量(1.6GB维基百科语料),维度为300,词汇量约13000,文件大小为41.2MB
2024/10/5 2:02:26 41.24MB 自然语言处理 预训练词向量
1
对于网络微博用户可信任性的问题,通过对爬取的所有源语料进行有目的的预处理,得到具有规范格式的用户数据,并从用户信息数据中,选择性的提取用户信息的完整度、活跃度、交际广度、传播力度四项指标组成指标体系;然后利用设计的层次分析法(AHP)结构模型,实现了对指标的权重系数数值确定,进而计算与统计用户的权威性。
最终完成对用户可信度模型的构建。
实验表明,该模型对微博用户的可信度评测方面有较好的准确性。
2024/9/25 1:19:21 307KB 权威性; 微博; 层次分析法
1
双向LSTM+CRF中文命名实体识别工具,可以使用自己的语料进行训练,欢迎大家交流学习。
训练数据需要自己进行获取
1
共 109 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡