各种版本的停用词,有746902120814471893哈工大停用词四川大学机器智能实验室停用词库百度停用词等等。
2024/3/30 2:28:20 37KB 停用词表 分词
1
结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表、以及网络上较大的一份无名称停用词表,整理的停用词表,2018-01-02整理
2024/3/29 14:23:41 33KB 停用词表整合
1
用于舆情系统,可以直接拿来算分使用
2024/3/23 9:52:45 366KB 情感分析 词库
1
自然语言处理情感分析舆情监测需要用到的最全中文情感和语义词库
2024/3/12 2:29:23 1.59MB 情感 词典 自然语言处理 nlp
1
该算法基于DFA并结合许多算法并进行相应的简化,最终其算法基本原理为:将所有敏感词库按模块聚合构建成一个词树(所谓聚合,就是将相同字开头的部分进行聚合,以减少对词的查询范围,相当于建立敏感词索引,如:他奶奶的、他妈的、他娘的,这三个词,聚合构建成词树时,“他”字就是这三个词的索引,同时每个词的结尾都有一个结束标志和该词的一些描述,如敏感级别等),然后从头到尾扫描一遍目标文本,当遇到以敏感词树中的索引的字时,查看后面的文本是否构成敏感词(如果这里有以这个敏感词开头的更长的敏感词时,以更长的为匹配结果,并判断该词在文本中前后是否有分隔符来区别其匹配方式),如果是则记录,一遍扫描完之后所有敏感词即被扫描出来了!
2024/3/11 17:54:55 112KB 敏感词过滤
1
搜狗的细胞词库是一个开放共享的词库,本程序是使用python获取搜狗词库官网上的所有下载链接,下载词库并进行分类保存。
需要注意的是,下载过来的文件格式为:.scel如果要转换为.txt,欢迎查看我的另一个下载资源。
欢迎下载交流!
2024/3/11 12:26:34 2KB 搜狗词库 爬虫 批量下载 分类
1
用于开发分词所使用的词库,自整理,后续还有更新,词根带词性以及排序
2024/3/1 11:32:25 8.3MB 中文词库 词性
1
在使用jiba分词的情况下,使用这个词典有助于提高你的分词准确度,因为这个分词词典包含了众多领域词汇,这些词汇出自某dog的几十个细胞词库。
已使用转换器转换成txt,欢迎下载。
2024/2/24 8:01:03 7.29MB 分词词典 中文分词 jieba gensim
1
sdcv字典词库博文链接:https://zhaoningbo.iteye.com/blog/1871466
2024/2/18 2:10:19 9.59MB 源码 工具
1
收集的聊天机器人词库,可用于聊天机器人的研发。
包含30个文本文件,物超所值。
2024/2/15 3:02:35 7.69MB 机器人 词库 聊天
1
共 164 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡