本书对数据挖掘的基本算法进行了系统介绍,每种算法不仅介绍了算法的基本原理,而且配有大量例题以及源代码,并对源代码进行了分析,这种理论和实践相结合的方式有助于读者较好地理解和掌握抽象的数据挖掘算法。
全书共分11章,内容同时涵盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法,具体章节包括绪论、数据预处理、关联规则挖掘、决策树分类算法、贝叶斯分类算法、人工神经网络算法、支持向量机、Kmeans聚类算法、K中心点聚类算法、神经网络聚类算法以及数据挖掘的发展等内容。
本书可作为高等院校数据挖掘课程的教材,也可以作为从事数据挖掘工作以及其他相关工程技术工作人员的参考书。
第1章绪论11.1数据挖掘的概念11.2数据挖掘的历史及发展11.3数据挖掘的研究内容及功能51.3.1数据挖掘的研究内容51.3.2数据挖掘的功能61.4数据挖掘的常用技术及工具91.4.1数据挖掘的常用技术91.4.2数据挖掘的工具121.5数据挖掘的应用热点121.6小结14思考题15第2章数据预处理162.1数据预处理的目的162.2数据清理182.2.1填充缺失值182.2.2光滑噪声数据182.2.3数据清理过程192.3数据集成和数据变换202.3.1数据集成202.3.2数据变换212.4数据归约232.4.1数据立方体聚集232.4.2维归约232.4.3数据压缩242.4.4数值归约252.4.5数据离散化与概念分层282.5特征选择与提取302.5.1特征选择302.5.2特征提取312.6小结33思考题33第3章关联规则挖掘353.1基本概念353.2关联规则挖掘算法——Apriori算法原理363.3Apriori算法实例分析383.4Apriori算法源程序分析413.5Apriori算法的特点及应用503.5.1Apriori算法特点503.5.2Apriori算法应用513.6小结52思考题52第4章决策树分类算法544.1基本概念544.1.1决策树分类算法概述544.1.2决策树基本算法概述544.2决策树分类算法——ID3算法原理564.2.1ID3算法原理564.2.2熵和信息增益574.2.3ID3算法594.3ID3算法实例分析604.4ID3算法源程序分析644.5ID3算法的特点及应用724.5.1ID3算法特点724.5.2ID3算法应用724.6决策树分类算法——C4.5算法原理734.6.1C4.5算法734.6.2C4.5算法的伪代码754.7C4.5算法实例分析764.8C4.5算法源程序分析774.9C4.5算法的特点及应用1014.9.1C4.5算法特点1014.9.2C4.5算法应用1014.10小结102思考题102第5章贝叶斯分类算法1035.1基本概念1035.1.1主观概率1035.1.2贝叶斯定理1045.2贝叶斯分类算法原理1055.2.1朴素贝叶斯分类模型1055.2.2贝叶斯信念网络1075.3贝叶斯算法实例分析1105.3.1朴素贝叶斯分类器1105.3.2BBN1125.4贝叶斯算法源程序分析1145.5贝叶斯算法特点及应用1195.5.1朴素贝叶斯分类算法1195.5.2贝叶斯信念网120思考题121第6章人工神经网络算法1226.1基本概念1226.1.1生物神经元模型1226.1.2人工神经元模型1236.1.3主要的神经网络模型1246.2BP算法原理1266.2.1Delta学习规则的基本原理1266.2.2BP网络的结构1266.2.3BP网络的算法描述1276.2.4标准BP网络的工作过程1296.3BP算法实例分析1306.4BP算法源程序分析1346.5BP算法的特点及应用1436.5.1BP算法特点1436.5.2BP算法应用1446.6小结145思考题145第7章支持向量机146
1