本书适合有志于从事数据挖掘的初学者,需求的朋友可看看第一部分数据挖掘与机器学习数学基础3第一章机器学习的统计基础3第二章探索性数据分析(EDA).11第二部分机器学习概述14第三章机器学习概述14第三部分监督学习---分类与回归16第四章KNN(k最邻近分类算法)16第五章决策树19第六章朴素贝叶斯分类29第七章Logistic回归.32第八章SVM支持向量机42第九章集成学习(EsembleLearning)43第十一章模型评估46第四部分非监督学习---聚类与关联分析50第十二章Kmeans聚类分析.50第十三章关联分析Apriori.52第十四章数据预处理之数据降维54第五部分Python数据预处理.57第十五章Python数据分析基础.57第十六章Python进行数据清洗.77第六部分数据结构与算法82第七部分SQL知识.86第八部分数据挖掘案例分析87案例一AJourneythroughTitanic597c770e.87案例二Analysisforairplane-crashes-since-190894案例三贷款预测问题98案例四KNN算法实现葡萄酒价格模型预测及交叉验证107
2015/1/23 5:02:50 4.4MB python 数据挖掘 算法
1
机械学习课程附带的程序练习,有很多简单的基础程序可供练习参考,自带鸢尾花数据等database
2022/9/6 7:24:18 13.79MB 机器学习 data modeling pca降维
1
Pandas是什么?1、一个强大的分析结构化数据的工具集2、基础是NumPy,提供了高功能矩阵的运算3、应用在数学挖掘,数据分析。
比如,学生成绩分析,股票数据分析等4、提供数据清洗功能Pands数据结构,主要分为两种,Series和DataFrame1、类似一维数组的对象2、通过list构建Seriesser_obj=pd.Series(rang(10))3、由数据和索引组成索引在左,数据在右索引是自动创建的4、获取数据和索引5、预览数据(取前几个)ser_obj.head(n)6、通过索引获取数据7、索引与数据的对应关系仍保持在数组运算的结果中(过滤series中的数据)8、通过dict构建
1
1.ETL的定义:是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。
是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去;
2.常用的ETL工具:次要有三大主流工具,分别是Ascential公司的Datastage、Informatica公司的Powercenter、NCRTeradata公司的ETLAutomation.还有其他开源工具,如PDI(Kettle)等。
2018/5/13 10:30:14 111KB ETL算法
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡