本书作者是国内较早接触Solr的技术专家之一,多年一直在Solr的研究、实践和布道的路上不遗余力、乐此不彼。
本书立足全球视野,综合Solr技术的发展和应用、从业人员的学习曲线,以及中英文资料的供给情况,给自己设定了一个极高的目标:力争在内容的全面性、系统性、深浅度和实战性上概括所有的同类书。
从完成的结果上来看,我们的目标接近完成,Solr的基础知识、核心技术、进阶知识和扩展知识悉数包括在内。
全书一共16章,分为上下两卷:上卷(第1~10章)全面、系统地讲解了Solr的基础知识和核心技术。
包括部署、配置、SolrCore、SolrDIH、全量导入、增量导入、索引、中文分词、查询组件、SolrFacet、高亮、查询建议,以及企业如何在真实的项目中使用Solr。
不仅讲解了基本概念和使用方法,而且还分析了各组件的内部工作机制。
下卷(第11~16章)细致、深入地讲解了Solr的高级知识和拓展知识。
高级知识部分包括:Solr的高级查询及其各种查询技巧,如函数查询、地理空间查询、Facet嵌套等;
SolrJ、SolrCloud、SpringDataSolr的使用详解和工作原理;
Solr的多种功能优化技巧,如索引的功能优化、缓存的功能优化、查询的功能优化、JVM和Web容器的优化,以及操作系统级别的优化。
拓展知识中首先讲解了Solr的一些比较生僻的知识点,如伪域、多语种索引支持、安全认证,以及Solr6.x中的SQL接口和Streaming表达式等;
然后讲解了Solr与MapReduce、HDFS、Hbase、Kafka、Flume、Storm、Spark等大数据技术的结合使用的集成方法。
2018/10/10 5:08:21 182.81MB solr
1
运用唐诗语料库,经过去噪预处理、分词、生成搭配、生成主题等过程,生成唐诗。
基于Python。
2022/9/8 11:07:41 5.84MB NLP
1
金融词条25万分词处理,金融数据阐发,金融词条25万分词处理,金融数据阐发,结巴分词
2022/9/8 5:33:15 4.92MB 结巴分词 金融数据分析 金融词条
1
elasticsearch-2.4.5以及配套的elasticsearch-analysis-ik-1.10.5解压es,在es根目录建树plugins目录,在plugins下建树ik目录,解压ik到ik。
2022/9/6 12:57:46 30.37MB 全文搜索
1
2016年上传过搜狗12个分类词库,两年没更新了,今天用程序重新跑了下数据获取到2018最新的数据,导出为txt格式,方便大家做分词用,我不生成词,我只是词的搬运工,版权归搜狗公司一切。
2022/9/5 19:46:49 37.08MB 搜狗 词库 分词 2018
1
同义词已经分词,txt文本格式。
格式类似于:baidu百度下的多了,积分自动上涨,挺坑。
我本来就是要求1分下载的。
2022/9/4 14:11:04 746KB 自然语言学习
1
基于深度学习、语音识别的结巴分词Jieba-Analysis项目,可在Eclipse和AndroidStudio下运转,识别语音的同时,可将关键词分割并输出
2022/9/3 17:41:08 5.29MB 语音识别 结巴分词
1
此词典由多个txt文件构成,各个txt分别为不同的类别,比如动漫、电影、电视剧、明星、篮球、美食等多个分类,每个txt中均为对应类目下的中文实体词典,对于分词,命名实体识别的准确率提升十分有协助!
2022/9/3 10:37:21 2.65MB 机器学习 自然语言处理
1
适用范围:搜索引擎源码,搜猫搜索源码,仿百度搜索引擎源码,PHP搜索源码,搜猫商业破解版演示地址:(以截图为准)http://ehs.so/运行环境:PHP、MYsql其他说明:搜猫搜索引擎V9.0最新商业版,价值1800元,官方原版,已破除域名限制,无任何功能限制。
此版本是目前最新的拥有与百度,soso,谷歌一样强大的功能!搜猫搜索引擎_V9.0正式版修复引见:1、整合Sphinx、倒排索引、PHPCWS分词系统,后台轻松一键创建索引和分词2、程序实现10亿数据的承载量,搜索永久小于1秒3、新增:充值卡系统、可以生成各种面额的充值卡、轻松充值积分进行竞价排名4、整合支付宝API接口,可以用支付宝在线充值积分进行竞价排名5、推广平台、搜索结果页右侧推广和开放平台实现智能规则排名,竞价同一关键词时以积分多少显示前三名推广的链接6、新增流量交换联盟。
7、多线程蜘蛛采集系统,达到日采集数据不低于1000000条
2022/9/3 1:26:11 7.51MB 搜猫V9.0 破解版
1
诗歌网一个唐宋诗词简单展示的web项目技术构成基于java,框架spring-boot+springMVC+Mybatis数据库为Mysqlweb模板采用freeMarker,以及ajax加载页面由vue重构::,原页面依旧保留查询实现1.mysql全文索引模糊查询通过mysql建立全文索引,未使用分词器,将最小分词数转换2:[mysqld]innodb_ft_min_token_size=2ft_min_word_len=22.分词问题不但mysql没有有效的中文分词器,而且针对古文/古诗的分词器根本就没有。
只进行了简单的分词,保留2个字的结果,放入关键字属性列。
3.查询速度查询采用了布尔布尔模糊婚配,效率虽然比直接模糊查询快,但有时也会很慢。
将查询结果前100条id插入表中,每次查询先查结果表。
数据源唐宋诗词收缩::本项目对应数据库下载(base64,更新时间2020/05/28):aHR0cCUzQS8vbXkuc25vd3RyYWNlcy5jb20vc2l0ZW1hcC9wb2V0cnktc3FsLnppcA==
2017/6/11 22:15:36 147KB mysql spring-boot ajax freemarker-template
1
共 215 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡