同时为发布和订阅提供高吞吐量。
据了解,Kafka每秒可以生产约25万消息(50MB),每秒处理55万消息(110MB)。
可进行持久化操作。
将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序。
通过将数据持久化到硬盘以及replication防止数据丢失。
分布式系统,易于向外扩展。
所有的producer、broker和consumer都会有多个,均为分布式的。
无需停机即可扩展机器。
消息被处理的状态是在consumer端维护,而不是由server端维护。
当失败时能自动平衡。
支持online和offline的场景。
2025/9/20 0:07:30 32.32MB 大数据 kafka
1
本书介绍了ES的命令行操作方式,集群的概念,怎样用JavaAPI来操作ES集群,并通过一个订单查询系统的电商实现来介绍ES在工程上的应用。
Kibana是一款非常非常好用的报表展示工具,专为ElasticSearch设计,不需要编程就可以做出任何你想要的查询和报表。
Logstash是一款非常非常好用的数据处理ETL软件,通过配置的方式的可以很灵活的将多种数据源抽取到各种目标数据库,并在过程中对数据进行各种配置化的处理。
按照本文的顺序阅读,并且加上自己的实践,笔者相信您一定能在极短的时间内掌握ElasticSearch的使用要点,让您的编程在视野上更上一个新的台阶!
2025/9/3 7:19:41 2.85MB 电商 搜索
1
LogCollector是一套基于ETL数据分析模型的分布式数据流系统,同时适用于云域内网数据传送和跨云数据传送;
同时支持Windows和Linux双系统平台(内置JRE8.X);
同时支持实时传送、离线传送和断点续传;
同时支持组件化集成、服务化管理和插件化扩展;
同时支持单机单实例、多实例部署以及跨云级别的分布式集群部署,分布式场景下通过过载熔断事务反馈机制来保障各子系统数据一致性,收集器可一键安装部署,自动识别系统环境并完成相应配置,无需任何附加操作,解压开箱即用。
该系统框架的功能和性能可直接秒杀ELK、Flume、Kettle等数据流工具,系统框架使用说明参考如下地址:https://blog.csdn.net/lixiang2114/article/details/114239052
2025/6/10 19:29:46 167.47MB ETL ELK Flume Kettle
1
【实时数仓篇】基于Flink的典型ETL场景实现
2025/5/27 7:42:19 24.31MB 大数据
1
下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人理解。
由于资历尚浅,难免会有很多错误,望批评指正!数据仓库包含的内容很多,它可以包括架构、建模和方法论。
对应到具体工作中的话,它可以包含下面的这些内容:以Hadoop、Spark、Hive等组建为中心的数据架构体系。
各种数据建模方法,如维度建模。
调度系统、元数据系统、ETL系统、可视化系统这类辅助系统。
我们暂且不管数据仓库的范围到底有多大,在数据仓库体系中,数据模型的核心地位是不可替代的。
因此,下面的将详细地阐述数据建模中的典型代表:维度建模,对它的的相关理论以及实际使用做深入的分析。
2025/2/10 4:56:32 143KB 漫谈数据仓库之维度建模
1
ETL工具,kettle资料库表结构word文档,详细介绍了kettle40多张表结构
2025/1/29 15:04:54 49KB kettle资料库
1
本文档中操作是本人亲自操作,测试成功后的总结,测试中发现了各种情况,最终还是顺利通过,望广大同行们多多指教。
Kettle是一个开源项目,作为ETL工具,kettle提供了丰富的功能和简洁的图形化界面。
作为免费开源的ETL工具,可以通过其桌面程序进行ETL步骤的开发并执行。
kettle以插件形式来实现每个转换步骤的工作,发行版中已经提供了常用的转换清洗插件,如果还不能满足业务需求的话,则可以自己开发相应插件实现。
2024/12/2 2:58:24 3.21MB KETTLE 源码 部署 ETL
1
Kettle是一款非常著名的ETL工具,何谓ETL?ETL就是Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程。
对于企业级的开发或应用,会遇到种种的数据转换,迁移等工作,所以作为开发者掌握ETL工具是必须的,那么其中Kettle就是一个强大的帮手,Kettle的数据抽取高效而又稳定,我们就来掌握它。
课程内容带领同学们由浅入深的学习Kettle,从课程简介,部署,Kettle入门到实战的课程都有系统化的教学。
2024/10/21 18:51:27 194B Kettle Kettle2020 Kettle入门
1
ETL工具Kettle用户手册
2024/9/23 13:01:15 23.02MB kettle
1
《DatawarehouseETLToolkit》的中文版,中文名为数据仓库ETL工具箱,一本介绍数据仓库ETL设计与开发的经典书籍,是Kimball数据仓库序列之作中的一本,其它两本为维度建模指南和数据仓库生命周期。
2024/8/26 20:10:10 4.55MB 数据仓库
1
共 50 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡