PDI最佳理论etl开发必备手册
2023/3/10 20:43:46 150KB etl pdi 最佳实践 大数据
1
PentahoKettle处理方案:使用PDI构建开源ETL处理方案MattCasters,RolandBouman,JosvanDongen等著,初建军,蔡雪梅译仅用于学习使用,不得用于商业用途,如有侵权,请告知
2023/2/4 7:25:07 94.42MB ETL Kettle
1
1.ETL的定义:是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。
是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去;
2.常用的ETL工具:次要有三大主流工具,分别是Ascential公司的Datastage、Informatica公司的Powercenter、NCRTeradata公司的ETLAutomation.还有其他开源工具,如PDI(Kettle)等。
2018/5/13 10:30:14 111KB ETL算法
1
Pentaho数据集成Pentaho数据集成(ETL)又名Kettle项目结构程序集:项目分发归档文件在此模块下生成核心:核心实现dbdialog:“数据库”对话框ui:用户界面引擎:PDI引擎engine-ext:PDI引擎扩展PDI核心插件集成:集成测试如何建造PentahoDataIntegration使用maven框架。
构建项目的先决条件:Maven,版本3+JavaJDK1.8/.m2目录中的这个建立它这是一个maven项目,要使用以下命令进行构建$mvncleaninstall(可选)您可以指定-Drelease以触发混淆和/或丑化(根据需要)(可选)您可以指定-Dmaven.test.skip=true跳过测试(即便您不应该知道)构建结果将是位于target的Pentaho软件包。
运行测试单元
2016/3/3 13:07:42 27.83MB 附件源码 文章源码
1
Kettle是一种开源的ETL处理方案,书中介绍了如何使用PDI来实现数据的剖析、清洗、校验、抽取、转换、加载等各类常见的ETL类工作。
除了ODS/DW类比较大型的应用外,Kettle实际还可以为中小企业提供灵活的数据抽取和数据处理的功能。
Kettle除了支持各种关系型数据库、HBase、MongoDB这样的NoSQL数据源外,它还支持Excel、Access这类小型的数据源。
并且通过插件扩展,Kettle可以支持各类数据源。
本书详细介绍了Kettle可以处理的数据源,而且详细介绍了如何使用Kettle抽取增量数据。
Kettle的数据处理功能也很强大,除了选择、过滤、分组、连接、排序这些常用的功能外,Kettle里的Java表达式、正则表达式、Java脚本、Java类等功能都非常灵活而强大,都非常适合于各种数据处理功能。
本书也使用了一些篇幅介绍Kettle这些灵活的数据处理功能。
2021/5/2 9:07:11 116.38MB Pentaho Kettle Solutions 中英版
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡