中文分词一直都是中文自然语言处理领域的基础研究。
目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。
而且不少中文分词软件支持Lucene扩展。
但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。
其中最为常见的是最大匹配算法(MaximumMatching,以下简称MM算法)。
MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。
本程序实现了正向最大匹配算法。
1
课程设计之初就对现阶段企业中流行技术及知识点进行过多次调研,整套课程设计完成后,技术点进行了100+以上项的增加与优化,JDK升级为1.8版本,加入Lambda表达式及其它新特性的讲解,引入spring全家桶(springboot/springdata/springcloud等),为了让我们的学员在就业市场上更具有竞争力,重点讲解了更多的大型互联网公司主流技术框架如Dubbo、Zookeeper、Lucene、Solr、Elasticsearch、MyCat、微信支付、Jenkins、AngularJS、SpringSecurityCAS、百度地图、GIT等。
1
由于林良益先生在2012之后未对IKAnalyzer进行更新,后续lucene分词接口发生变化,导致不可使用,所以此jar包支持lucene6.0以上版本
2025/11/23 17:44:21 5.46MB IKAnalyzer lucene6
1
lucene文档检索系统,java源码,可执行程序,支持pdf,doc,xls,ppt,html,txt。
2025/10/27 17:10:34 8.23MB lucene java 源码 信息检索
1
lucene4.6所有jar包lucene搜索引擎可以网上找教程,但是貌似网上的都太旧了,4.6改动挺大的,构造函数都有很大差异~~无语啊!
2025/9/17 10:58:44 15.93MB lucene 搜索引擎
1
基于lucene的Swing全文索引构建于查询工具及源程序,有源程序以及做好的工具,非常适合初学者学习学习lucene
2025/6/23 4:19:18 7.9MB lucene 全文检索 swing 索引构建
1
本Demo实现了lucene分词和查询,Dao中实现了lucene的几个基本方法.
2025/5/31 5:58:25 1.13MB 爬虫、lucene
1
基于lucene实现word、ppt、excel、pdf、txt全文检索
2025/5/29 12:02:03 23.85MB lucene word ppt excel
1
实验课的项目,爬虫爬取网站内容,lucene实现索引和搜索功能,界面也很美观。
爬取的是重庆大学新闻网的内容。
2025/4/24 18:13:24 12.8MB Java Web 新闻 网站
1
从c#基础开始,逐渐深入,是学习搜索引擎开发的*。
应众多公司的实际需求,《使用c#开发搜索引擎》介绍如何以c#作为工具开发搜索引擎。
全书以完成一个网站搜索\垂直搜索作为目标,从网络爬虫抓取数据开始,然后到中文分词、文本排重等文本挖掘技术和搜索结果展现。
本书是市面上介绍业界热门的lucene.net、使用webbrowser做爬虫以及结合solr开发asp.net搜索的第一书。
  《使用c#开发搜索引擎》适合专业软件开发人员,也适合于希望学习搜索引擎工作原理的读者学习使用。
本书对于在校学生学习复杂数据结构和应用动态规划等常用算法也有参考价值。
2025/3/20 1:47:48 95.02MB C# PDF Lucene.Net
1
共 63 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡