随着互联网飞速发展,企业业务种类会越来越多,业务数据量会越来越大,当发展到一定规模时,传统的数据存储结构逐渐无法满足企业需求,实时数据仓库就变成了一个必要的基础服务。
以维表Join为例,数据在业务数据源中以范式表的形式存储,在分析时需要做大量的Join操作,降低性能。
如果在数据清洗导入过程中就能流式的完成Join,那么分析时就无需再次Join,从而提升查询性能。
利用实时数仓,企业可以实现实时OLAP分析、实时数据看板、实时业务监控、实时数据接口服务等用途。
但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护。
而得益于新版Flink对SQL的支持,以及TiDBHTAP的特性,我们探索了一
1
尚硅谷大数据项目之电商数仓(2用户行为数据仓库),你值得拥有,欢迎一起学习和交流!!!
2024/5/23 13:54:46 3.62MB hive hadoop
1
本次主要分享关于迁移实际案例与最佳实践更加深入的探讨。
在迁移过程中,我们遇到了很多的预料之外的问题,如字符集问题,数字进位问题,各种OOM等等,更加深入地了解了Spark和RDMBS之间的差异。
在弥补鸿沟和解决问题的过程中,我们做了很多的实践,贡献给了社区很多的反馈,也解决了很多的bug。
即便对于Spark当前不能处理的场景,比如recurisvequery,也有了一些可行的探索。
此外,我们现在还开发了一套自动化框架来帮助加速迁移工作。
在这次分享中,我们会深入迁移的关键步骤,并分享踩过的一些坑,最后会介绍我们的自动化工具,如SQLConverter等。
相信对正工作在类似的任务或者即将开展类似工作的工程师们会有所帮助。
下面是PPT原文:关注Hadoop技术博文并回复ebay_spark获取本文PPT。
2024/3/21 13:19:03 14.5MB ebay iteblo 过往记忆
1
hivesparkhadoop
2024/2/26 12:05:22 7.89MB hive spark hadoop
1
数仓模型
2024/2/13 19:12:40 80KB 数仓模型介绍
1
pdf密码是:dsjsfc总结了大数据开发基础组件如:hadoop,hive,spark,kafka,hbase,数仓,flink,java,es,flume,等面试体
2024/2/4 3:51:39 3.27MB 大数据
1
大数据项目之电商数仓(3系统业务数据仓库).docx
2024/2/3 0:13:06 8.61MB 电商数仓
1
目录:仅1年GitHubStar数翻倍,ApacheFlink做了什么?4Lyft基于ApacheFlink的大规模准实时数据分析平台15日均处理万亿数据!ApacheFlink在快手的应用实践与技术演进之路26bilibili实时平台的架构与实践47美团点评基于ApacheFlink的实时数仓平台实践70小米流式平台架构演进与实践90Netflix:EvolvingKeystonetoanOpenCollaborativeReal-timeETLPlatform108OPPO基于ApacheFlink的实时数仓实践115
2024/1/23 1:19:23 17.65MB Flink 技术文档 大数据 数仓平台
1
介绍大数据中台、数仓、大数据平台等大数据领域的一些方法论
2023/12/21 16:04:22 16KB 大数据 数据仓库
1
greenplum的开发规范文档,规范化数仓MPP数据库的使用
2023/11/6 2:12:56 804KB gbdp greenplum MPP数据库
1
共 25 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡