用VB进行的分词实验,包括词频、字频统计
2019/5/14 1:30:43 3.08MB vb 中文分词
1
IKAnalyzer3.2.5jar配合lucene完成中文分词
2021/4/16 17:44:55 1.11MB IKAnalyzer 3.2.5
1
IKAnalyzer3.2.5jar配合lucene完成中文分词
2020/11/8 14:42:44 1.11MB IKAnalyzer 3.2.5
1
30万中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方式.txt,五笔词库.TXT解压密码为:www.5eyi.com想省资源分可以到http://www.5eyi.com/download-sphinx-chinese-word-lexicon-collected/下载
1
该版本是免费版和商业版本通透。
商业版本用户请输入本人的商业版用户名密码即可登录使用。
2014.6.18版本主要更新的内容1.修复高dpi下采集器登录界面错位的问题2.修复中文分词存在的问题3.修复任务完成后不能关机的问题4.生成Word和Excel可选2007和2003格式5.增加任务规则异常报警功能。
6.添加了批量关闭已完成任务窗口功能7.修复文件下载中存在的一些问题8.修复边采集发布为excel无内容的bug9.修复二级代理Session中url的组合错误10.升级插件内核心,增加伪原创等插件
2018/8/7 12:28:46 33.16MB 采集器
1
中文分词用统计词频辞书,一词一行,txt文本保存
2019/8/21 11:35:43 2.46MB 中文 分词 词频 词典
1
java版结巴分词工具,一个很好的中文分词工具。
直接用eclipse打开,输入是一篇文章,然后输出是每个词的词频,并且词频是按照大小从次数最高到次数最低排的,只需求在test包里改部分代码就可以使用了。
不下你会后悔的。
2016/3/17 4:14:30 3.91MB 结巴分词
1
最新的ansj分词工具jar包,用于在ecplise中使用ansj分词。
ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。
分词速度达到每秒钟大约200万字左右(macair下测试),精确率能达到96%以上。
目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。
可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。
作者在最新的分词方式里增加了基于深度学习的分词方式。
2016/6/8 1:32:57 19.72MB ansj jar包
1
中文分词不断都是中文自然语言处理领域的基础研究。
目前,分词系统绝大多数都是基于中文词典的匹配算法。
其中最为常见的是最大匹配算法(MaximumMatching,以下简称MM算法)。
MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。
本程序实现了正向最大匹配算法。
本程序还可以从我的github上面下载:https://github.com/Zehua-Zeng/Maximum-Matching-Algorithm
1
java中文分词,协同过滤算法词频分析,javaGUI界面开端,生成java数据词云
2016/8/26 19:30:10 207KB java
1
共 74 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡