本书对数据挖掘的基本算法进行了系统介绍,每种算法不仅介绍了算法的基本原理,而且配有大量例题以及源代码,并对源代码进行了分析,这种理论和实践相结合的方式有助于读者较好地理解和掌握抽象的数据挖掘算法。
全书共分11章,内容同时涵盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法,具体章节包括绪论、数据预处理、关联规则挖掘、决策树分类算法、贝叶斯分类算法、人工神经网络算法、支持向量机、Kmeans聚类算法、K中心点聚类算法、神经网络聚类算法以及数据挖掘的发展等内容。
本书可作为高等院校数据挖掘课程的教材,也可以作为从事数据挖掘工作以及其他相关工程技术工作人员的参考书。
第1章绪论11.1数据挖掘的概念11.2数据挖掘的历史及发展11.3数据挖掘的研究内容及功能51.3.1数据挖掘的研究内容51.3.2数据挖掘的功能61.4数据挖掘的常用技术及工具91.4.1数据挖掘的常用技术91.4.2数据挖掘的工具121.5数据挖掘的应用热点121.6小结14思考题15第2章数据预处理162.1数据预处理的目的162.2数据清理182.2.1填充缺失值182.2.2光滑噪声数据182.2.3数据清理过程192.3数据集成和数据变换202.3.1数据集成202.3.2数据变换212.4数据归约232.4.1数据立方体聚集232.4.2维归约232.4.3数据压缩242.4.4数值归约252.4.5数据离散化与概念分层282.5特征选择与提取302.5.1特征选择302.5.2特征提取312.6小结33思考题33第3章关联规则挖掘353.1基本概念353.2关联规则挖掘算法——Apriori算法原理363.3Apriori算法实例分析383.4Apriori算法源程序分析413.5Apriori算法的特点及应用503.5.1Apriori算法特点503.5.2Apriori算法应用513.6小结52思考题52第4章决策树分类算法544.1基本概念544.1.1决策树分类算法概述544.1.2决策树基本算法概述544.2决策树分类算法——ID3算法原理564.2.1ID3算法原理564.2.2熵和信息增益574.2.3ID3算法594.3ID3算法实例分析604.4ID3算法源程序分析644.5ID3算法的特点及应用724.5.1ID3算法特点724.5.2ID3算法应用724.6决策树分类算法——C4.5算法原理734.6.1C4.5算法734.6.2C4.5算法的伪代码754.7C4.5算法实例分析764.8C4.5算法源程序分析774.9C4.5算法的特点及应用1014.9.1C4.5算法特点1014.9.2C4.5算法应用1014.10小结102思考题102第5章贝叶斯分类算法1035.1基本概念1035.1.1主观概率1035.1.2贝叶斯定理1045.2贝叶斯分类算法原理1055.2.1朴素贝叶斯分类模型1055.2.2贝叶斯信念网络1075.3贝叶斯算法实例分析1105.3.1朴素贝叶斯分类器1105.3.2BBN1125.4贝叶斯算法源程序分析1145.5贝叶斯算法特点及应用1195.5.1朴素贝叶斯分类算法1195.5.2贝叶斯信念网120思考题121第6章人工神经网络算法1226.1基本概念1226.1.1生物神经元模型1226.1.2人工神经元模型1236.1.3主要的神经网络模型1246.2BP算法原理1266.2.1Delta学习规则的基本原理1266.2.2BP网络的结构1266.2.3BP网络的算法描述1276.2.4标准BP网络的工作过程1296.3BP算法实例分析1306.4BP算法源程序分析1346.5BP算法的特点及应用1436.5.1BP算法特点1436.5.2BP算法应用1446.6小结145思考题145第7章支持向量机146
2023/9/24 16:34:35 31.33MB 数据挖掘 算法 数据仓库
1
此matlab的mrmrd程序代码是基于特征选择的代码,可以筛选出最优的特征。
2023/8/28 6:58:18 483B matlab mrmrd
1
该代码实现了一对一的SVMRFE算法主要是用于特征选择算法速度快是SVMRFE的改进版本
2023/8/24 13:21:15 2KB OVO
1
文件内有一个函数文件和CMFS.m文件,调用这两个即可。
另外还有几个标准数据集用来测试。
特征选择可以用来进行机器学习和数据挖掘,希望此资源可以帮助到大家,有不足之处,望指出并相互探讨。
2023/8/13 8:48:52 141KB CMFS
1
机器学习的利器!特征选择的法宝!kaggle必备书!-----ShiLong
2023/8/5 0:28:58 13.61MB 特征选择 机器学习 kaggle
1
该代码是最小冗余最大相关性(mRMR)代码,里面也包含了数据和案例,很容易跑通代码。
2023/7/16 17:06:23 9.84MB 特征筛选
1
摘要:应用信号处理方法对振动信号进行特征提取的技术是机械设备故障诊断领域的重要研究方向。
常用的机械设备故障诊断领域的信号处理方法主要包括时域分析、频域分析和时频分析。
针对常用的振动信号处理方法,总结多种算法的特征和优缺点。
根据常见机械设备关键构件的振动特征,选择不同的信号处理和特征提取算法进行分析,以便提高多种构件、多类故障的特征提取精度和可靠性,从而为有效地实现机械设备的故障提供参考。
关键词:振动与波;
故障诊断;
振动信号;
特征提取;
信号处理
2023/6/4 15:12:06 402KB 论文
1
本工具为复旦大学计算机学院机器人研究实验室开发的基于深度学习的中文自然语言处理工具FudanDNN-NLP2.0,该工具可用于中文分词、自定义词汇、文本规范化、命名识别、词性标注、语义分析,用户可以根据需要重新训练或者精调模型。
深度学习方法的优点在于不需要预先根据任务进行特征选择(特征工程),系统所需参数较少(节省内存开销),并且解码速度(实际使用)远远快于其它相似性能的系统。
2023/5/30 14:42:47 58.86MB 深度学习
1
FeatureSelectionwiththeBorutaPackage的中文翻译全文FeatureSelectionwiththeBorutaPackage的中文翻译全文FeatureSelectionwiththeBorutaPackage的中文翻译全文应用boruta算法进行特征选择,详细的例子和算法的解释
2023/3/20 18:51:18 196KB R语言 Boruta算法
1
为了处理特征选择的算法冗余问题,设计了CES算法,但其应为范围不包括连续函数,所以扩展出了DES算法
2023/3/20 6:27:37 1.09MB DES算法
1
共 49 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡