高效敏感词过滤JAVA实现(DFA算法)5000字2ms节点+2进制标识(节省空间/提高查询效率)附源码、注释,附带专业敏感词库(3396个敏感词)看得上就拿去用,替换下一两处util方法、改个路径即可不求什么,用得好的话,记得有那么一个人提供就够了。
如遇问题,欢迎交流。
QQ463550192普通PC测试结果: 2015-5-1加载时间:41542826ns加载时间:41ms解析字数:5000解析时间:2295131ns解析时间:2ms
2024/5/7 3:34:40 23KB 敏感词过滤 高效敏感词 DFA算法
1
该算法基于DFA并结合许多算法并进行相应的简化,最终其算法基本原理为:将所有敏感词库按模块聚合构建成一个词树(所谓聚合,就是将相同字开头的部分进行聚合,以减少对词的查询范围,相当于建立敏感词索引,如:他奶奶的、他妈的、他娘的,这三个词,聚合构建成词树时,“他”字就是这三个词的索引,同时每个词的结尾都有一个结束标志和该词的一些描述,如敏感级别等),然后从头到尾扫描一遍目标文本,当遇到以敏感词树中的索引的字时,查看后面的文本是否构成敏感词(如果这里有以这个敏感词开头的更长的敏感词时,以更长的为匹配结果,并判断该词在文本中前后是否有分隔符来区别其匹配方式),如果是则记录,一遍扫描完之后所有敏感词即被扫描出来了!
2024/3/11 17:54:55 112KB 敏感词过滤
1
用JavaSocket编程开发聊天室用JavaURL编程爬取并分析网页敏感词
2024/1/16 0:42:02 800KB java 实验报告 中南大学
1
各大平台网络内容敏感词库过滤词库,百度敏感词库,自媒体敏感词库,包括各大主流平台,发布文案文章前查一查避免进入漫长的人工复核,之后还可能被退回修改,帮助你节约时间。
2023/12/5 1:11:04 214KB 敏感词 过滤词 文案 自媒体
1
★程序说明:★☆网站技术:☆架构体系:数据访问层(DataAccessLayer)(LINQtoSQL实现)存储库层(RepositoryLayer)(Repository模式实现)服务层(ServiceLayer)表示层(PresentationLayer)(MVP(Model-View-Presenter)模式实现)底层使用技术:01.控制反转(InversionofControl)(StructureMap实现)02.日志技术(Log4Net实现)03.缓存技术(标准)(System.Web.Caching实现)04.缓存技术(高级)(EnyimCache实现)05.全文检索技术(Lucene.Net实现)06.扩展方法(ExtendsMethod)07.动态验证码(System.Drawing实现)08.密码加密(System.Security.Cryptography实现)09.发送邮件(实时)(System.Net.Mail实现)10.发送邮件(队列)(MSMQ实现)页面使用技术:01.模板页(MasterPage)02.主题(Theme)03.皮肤(Skin)04.用户自定义控件(UserControl)05.站点地图(Web.sitemap实现)06.URL重定向(UrlRewrite)07.可视化HTML编辑器(XinhaEditor)08.多文件上传(Flash实现)09.星级评分(AjaxControlToolkitRating实现)☆网站模块:☆-用户账号模块(UserAccounts)(功能:账号注册、账号登陆、密码找回、编辑账号信息、验证邮箱真实性)-用户资料模块(UserProfiles)(功能:资料管理、资料显示、上传头像、设置隐私级别、动态消息显示墙)-好友模块(Friends)(功能:查找好友、站内邀请好友、邮件邀请好友、导入好友邮箱、添加好友关系、删除好友关系、微博心情说说)-站内信模块(Messages)(功能:发送站内信、删除站内信,回复站内信)-图片相册模块(Albums)(功能:创建相册、编辑相册、删除相册、上传图片、编辑图片、删除图片)-博客模块(Blogs)(功能:创建博客、编辑博客、删除博客)-论坛模块(Forums)(功能:创建帖子、回复帖子)-圈子模块(Groups)(功能:创建圈子、申请加入圈子、审核加入申请、参与圈子话题讨论)-评论/标签/评级模块(Commenting/Tagging/Rating)(功能:发表评论,添加标签、添加评级)-网站监控模块(Moderation)(功能:敏感词过滤、恶意脚本过滤、非法内容举报、非法内容审核)☆管理员账号:☆-用户名:Lenovo-密 码:88888888☆开发环境:☆-[开发语言版本]C#3.0-[.NetFramework版本]3.5-[VisualStudio版本]MicrosoftVisualStudio2008withSP1-[SQLServer版本]MicrosoftSQLServer2008R2withSP2☆文件内容:☆-[电子书]-[数据库]-[源代码]-[程序运行说明]
2023/11/29 10:01:16 26.25MB .Net C# ASP.NET SNS
1
例如你能够想到的那些敏感词汇,但是在做开发的时候不想让这些词汇流到客户的手里,那么可以使用该表做过滤。
该表适用txt格式,方便适用流读取,一行一个,您可以一次读一行,然后放到List中。
2023/9/23 11:38:37 9KB 网络 敏感词 过滤
1
这应该是CSDN中最全的敏感词库了,我搜索了多个CSDN已有的敏感词库,然后用JAVA去重,整理后的版本,欢迎大家下载,文件中敏感词以换行符分割(每行一个敏感词),词语多达6000+
2023/7/10 11:47:51 73KB 敏感词 禁词 违禁词 敏感字
1
此体系推选给低级java学习者,本体系可统计英文文章中敏感词涌现的次数,敏感词存在不合或者不合txt文件中,并到场了单词盘问成果,能够在盘问窗口中输入单个单词,体系会盘问后给出涌现次数及涌现位置
2023/5/4 12:12:42 185KB java 敏感词统计
1
中文敏感词库、各种停用词表以及各种分词词库,txt格式方便适用
2017/2/23 12:32:55 21.62MB 敏感词库 停用词 各种词库
1
从其他地方下载的,分享给大家,外面有四种方式,分别为不同的算法
2016/3/8 1:51:01 3.29MB 网站敏感词检测
1
共 16 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡