倒排索引(InvertedIndex)被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,是目前几乎所有支持全文索引的搜索引擎都需要依赖的一个数据结构。
资源中包含了MapReduce实现的文档倒排索引的源码、jar包、测试数据(包含停词表)和结果。
2024/9/15 10:22:16 3.55MB MapRed Java Hadoop SDU
1
最近在学习MySQL技术内幕 InnoDB存储引擎 第2版,整理了一些文档分享出来,同时也方便以后查看。
若有不当之处,烦请批评指正。
1.MySQL体系结构和存储引擎2.InnoDB存储引擎2.1InnoDB体系结构2.2Checkpoint技术2.3MasterThread工作方式2.4InnoDB关键特性3.文件3.1参数文件3.2日志文件3.3套接字文件3.4pid文件3.5表结构定义文件3.6InnoDB存储引擎文件4.表4.1索引组织表4.2InnoDB逻辑存储结构4.3行记录格式4.4InnoDB数据页结构5.索引与算法5.1概述5.2数据结构与算法5.3B+树索引5.4B+树索引的分裂5.5Cardinality值5.6全文索引6.锁-实现事务的隔离性6.1什么是锁6.2lock和latch6.3InnoDB存储引擎中的锁6.4锁的算法6.5锁问题6.6阻塞6.7死锁6.8锁升级7.事务7.1概述7.2事务的实现7.3事务控制语句7.4隐式提交的SQL语句7.5不好的事务习惯8备份与恢复8.1备份与恢复概述8.2冷备8.3逻辑备份8.4二进制日志备份与恢复8.5热备8.6快照备份8.7复制
2024/7/8 3:47:49 3.1MB MySQL InnoDB
1
AnyTXTSearcher是一款优秀的且完全免费同时又高效易用的电脑纯本地文本搜索工具,具备强而有力的文档解析引擎可以进行快速全文索引(自动同步索引),从而拥有了强悍的全文本文件和文档搜索功能,支持AES256位军事级加密且能按文档内容搜索,并对SSD固态硬盘做了诸多优化,就像是电脑本地的百度和谷歌搜索引擎一样,用户对它的评价远超Windows系统内置的索引功能,甚至比GoogleDesktop都要高,无论用户的目标文本文件存放在电脑硬盘中的哪个角落,anytxtsearcher软件都能帮助用户进行闪电般的进行搜索并在转瞬间快速找出客户所需的目标文本文件和文档。
1
MyISAM存储引擎MyISAM是MySQL官方提供默认的存储引擎,其特点是不支持事务、表锁和全文索引,对于一些OLAP(联机分析处理)系统,操作速度快。
每个MyISAM在磁盘上存储成三个文件。
文件名都和表名相同,扩展名分别是.frm(存储表定义)、.MYD(MYData,存储数据)、.MYI(MYIndex,存储索引)。
这里特别要注意的是MyISAM不缓存数据文件,只缓存索引文件。
InnoDB存储引擎InnoDB存储引擎支持事务,主要面向OLTP(联机事务处理过程)方面的应用,其特点是行锁设置、支持外键,并支持类似于Oracle的非
2023/12/26 6:51:56 3KB Mysql 事务 隔离级别
1
SqlServer2008数据库课设报告(图书管理系统)包一下全部要求,数据库设计完整sql代码:1.数据库设计要求数据库设计要合理,对数据库设计作必要的说明并抓图。
数据库名必须与自己真实姓名有关,所有同学不能同名。
图不要太大,看清即可。
2.数据表设计要求数据表设计要合理,要符合数据库设计的理论范式,对数据表设计作必要的说明并抓图。
数据表名必须与自己真实姓名有关,所有同学不能同名。
3.视图设计要求根据系统需求作必要的视图设计,如在一次查询中涉及到多个表,应该创建视图。
不可以只取一个表的几个字段就算创建视图。
4.索引设计要求根据系统需求作必要的索引设计,本系统需要的聚集索引、非聚集索引、唯一索引、全文索引等。
5.数据完整性设计根据系统需求作必要的数据完整性设计,本系统需要的实体完整性体现、域完整性体现、参照完整性体现等。
6.存储过程和触发器设计根据系统需求作必要的存储过程和触发器设计,本系统需要的存储过程和触发器设计。
必要的存储过程和触发器设计都要写全说明,图可以是一个表的完整存储过程或触发器。
7.备份与恢复设计根据系统需求作必要的备份与恢复设计,如需要对那些内容备份,备份策略、由谁来做备份、什么时间做备份等。
8.数据库安全设计根据系统需求作必要的数据库安全设计,如本系统分几级用户、分别是什么角色成员具有什么操作权限等。
2023/8/1 13:38:30 284KB SQL Server 图书管理系统 数据库设计
1
百度文库的在线预览ppt(flashpaper)
2023/7/7 8:09:31 10.32MB 仿百度文库 flash阅读器
1
Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。
Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。
在Java开发环境里Lucene是一个成熟的免费开源工具。
就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。
本压缩包提供了lucene4.6.0下所有的jar包集合,供大家下载使用。
2023/6/9 9:06:21 20.01MB 自然语言处理 Lucene java
1
斯芬克斯全中文搜索引擎加主动分词mysql+swsc+php,全文索引
2023/2/19 18:33:50 10.56MB 全文索引 spinx 自动分词
1
Thepurposeofthissystemistostoredocumentsinelectronicformatinasinglerepositoryandautomatetheprocessesoftheirexecutionandconsideration.Intheseprocessesdocumentspassthroughdeterminedroutes.Theypassonfromonepersontoanother.Ateachpointofsucharouteapersonmakesadecisionorexecutesthedocument.
2023/2/5 19:34:37 868KB Document Management
1
诗歌网一个唐宋诗词简单展示的web项目技术构成基于java,框架spring-boot+springMVC+Mybatis数据库为Mysqlweb模板采用freeMarker,以及ajax加载页面由vue重构::,原页面依旧保留查询实现1.mysql全文索引模糊查询通过mysql建立全文索引,未使用分词器,将最小分词数转换2:[mysqld]innodb_ft_min_token_size=2ft_min_word_len=22.分词问题不但mysql没有有效的中文分词器,而且针对古文/古诗的分词器根本就没有。
只进行了简单的分词,保留2个字的结果,放入关键字属性列。
3.查询速度查询采用了布尔布尔模糊婚配,效率虽然比直接模糊查询快,但有时也会很慢。
将查询结果前100条id插入表中,每次查询先查结果表。
数据源唐宋诗词收缩::本项目对应数据库下载(base64,更新时间2020/05/28):aHR0cCUzQS8vbXkuc25vd3RyYWNlcy5jb20vc2l0ZW1hcC9wb2V0cnktc3FsLnppcA==
2017/6/11 22:15:36 147KB mysql spring-boot ajax freemarker-template
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡