数据挖掘算法算法目录18大DM算法包名 目录名 算法名AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法AssociationAnalysis DataMining_FPTree FPTree-频繁模式树算法BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升算法Classification DataMining_CART CART-分类回归树算法Classification DataMining_ID3 ID3-决策树分类算法Classification DataMining_KNN KNN-k最近邻算法工具类Classification DataMining_NaiveBayes NaiveBayes-朴素贝叶斯算法Clustering DataMining_BIRCH BIRCH-层次聚类算法Clustering DataMining_KMeans KMeans-K均值算法GraphMining DataMining_GSpan GSpan-频繁子图挖掘算法IntegratedMining DataMining_CBA CBA-基于关联规则的分类算法LinkMining DataMining_HITS HITS-链接分析算法LinkMining DataMining_PageRank PageRank-网页重要性/排名算法RoughSets DataMining_RoughSets RoughSets-粗糙集属性约简算法SequentialPatterns DataMining_GSP GSP-序列模式分析算法SequentialPatterns DataMining_PrefixSpan PrefixSpan-序列模式分析算法StatisticalLearning DataMining_EM EM-期望最大化算法StatisticalLearning DataMining_SVM SVM-支持向量机算法其他经典DM算法包名 目录名 算法名Others DataMining_ACO ACO-蚁群算法Others DataMining_BayesNetwork BayesNetwork-贝叶斯网络算法Others DataMining_CABDDCC CABDDCC-基于连通图的分裂聚类算法Others DataMining_Chameleon Chameleon-两阶段合并聚类算法Others DataMining_DBSCAN DBSCAN-基于密度的聚类算法Others DataMining_GA GA-遗传算法Others DataMining_GA_Maze GA_Maze-遗传算法在走迷宫游戏中的应用算法Others DataMining_KDTree KDTree-k维空间关键数据检索算法工具类Others DataMining_MSApriori MSApriori-基于多支持度的Apriori算法Others DataMining_RandomForest RandomForest-随机森林算法Others DataMining_TAN TAN-树型朴素贝叶斯算法Others DataMining_Viterbi Viterbi-维特比算法18大经典DM算法18大数据挖掘的经典算法以及代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应算法的博文链接,希望能够协助大家学。
目前追加了其他的一些经典的DM算法,在others的包中涉及聚类,分类,图算法,搜索算等等,没有具体分类。
C4.5C4.5算法与ID3算法一样,都是数学分类算法,C4.5算法是ID3算法的一个改进。
ID3算法采用信息增益进行决策判断,而C4.5采用的是增益率。
详细介绍链接CARTCART算法的全称是分类回归树算法,他是一个二元分类,采用的是类似于熵的基尼指数作为分类决策,形成决策树后之后还要进行剪枝,我自己在实现整个算法的时候采用的是代价复杂度算法,详细介绍链接KNNK最近邻算法。
给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。
近的点的权重大点,远的点自然就小点。
详细介绍链接NaiveBayes朴素贝叶斯算法。
朴素贝叶斯算法是贝叶斯算法里面一种比较简单的分类算法,用到了一个比较重要的贝叶斯定理,用一句简单的话概括就是条件概率的相互转换推导
1