3.1 数据架构设计 3.1.1 数据主题 主题是对业务数据的一种抽象,是在较高层次上对京东信息系统中的数据进行归纳、整理、综合、归类和分析利用的一个抽象概念。
面向主题的数据组织和存储包含两个方面:一是根据业务的特点来抽象出主题。
二是根据源系统业务数据的内容确定每个主题所包含的数据内容。
分析得出的数据主题是对分析对象数据的一个完整并且一致的描述,能刻画各个分析对象所涉及的企业数据。
我们对京东所有业务数据进行了逐一梳理,得到京东的数据主题如图 22 所示。
图 22:数据主题域划分
2025/6/19 9:27:29 5.31MB
1
下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人理解。
由于资历尚浅,难免会有很多错误,望批评指正!数据仓库包含的内容很多,它可以包括架构、建模和方法论。
对应到具体工作中的话,它可以包含下面的这些内容:以Hadoop、Spark、Hive等组建为中心的数据架构体系。
各种数据建模方法,如维度建模。
调度系统、元数据系统、ETL系统、可视化系统这类辅助系统。
我们暂且不管数据仓库的范围到底有多大,在数据仓库体系中,数据模型的核心地位是不可替代的。
因此,下面的将详细地阐述数据建模中的典型代表:维度建模,对它的的相关理论以及实际使用做深入的分析。
2025/2/10 4:56:32 143KB 漫谈数据仓库之维度建模
1
第一阶段:这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。
通过项目实践,你能快速掌握这些技术,获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。
第二阶段:这一阶段会学习FLume、Kafka、SparkStreaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术,以及大数据体系内的数据采集和数据仓库理论思想和技术实现。
通过项目实践,你能快速掌握这些技术,获得完整的大数据架构开发能力。
第三阶段:这一阶段会学习NLP文本相似度、中文分词、HMM算法、推荐算法CF、回归算法等应用与开发技术,整体认识商业项目-音乐推荐系统。
使用海量真实数据对大数据平台和算法进行应用实践,快速掌握大数据行业具有巨大价值的核心技术。
第四阶段:这一阶段会学习分类算法、聚类算法、分类算法-决策树、分类算法-SVM、神经网络+深度学习,深化前3阶段技术能力,初入机器学习领域。
通过对机器学习核心算法的强化练习,你将能完美胜任目前人才最紧缺的数据挖掘开发职位。
2024/10/13 15:34:27 128B 大数据 机器学习 数据挖掘
1
案例练习:1、国内500强集团业务架构设计实践案例介绍2、业务架构实例练习与点评;
3、业务组件模型与业务流程模型应用练习;
案例练习:1、 金融、学校、钢铁、能源等多行业应用架构设计实践案例介绍;
2、 应用架构设计案例实操。
案例练习:1、大型企业数据架构设计案例赏鉴2、企业交互数据表收集、数据建模案例练习案例练习:1、 各行业大型企业基础架构案例鉴赏;
2、 企业基础架构案例练习;
2024/7/29 17:26:44 5.38MB 企业架构 架构案例
1
近年Qcon上知名互联网公司大数据架构分享集合(PDF文件),包括LinkedIn,腾讯,大众点评,饿了么,京东等
2024/6/19 18:03:33 15.36MB 大数据 架构 Qcon 互联网
1
银行业如何应对数据治理监管,从顶层设计、数据战略、组织架构、数据治理机制、章程政策、持续运行优化、考核激励体系、考核体系实践、数据质量管理、数据安全管理、个人隐私数据保护、数据架构的设计与规划、数据管理平台等方面进行介绍银行业数据治理的实践。
1
中国联通IT系统数据架构规范_第三分册_数据编码规范分册
2024/2/20 8:48:41 13.66MB 数据编码规范
1
本文来自于jianshu,文章主要分析了目前数据处理领域使用比较多的几种架构,详细对架构优缺点和使用场景进行了引见。
数据分析工作虽然隐藏在业务系统背后,但是具有非常重要的作用,数据分析的结果对决策、业务发展有着举足轻重的作用。
随着大数据技术的发展,数据挖掘、数据探索等专有名词曝光度越来越高,但是在类似于Hadoop系列的大数据分析系统大行其道之前,数据分析工作已经经历了长足的发展,尤其是以BI系统为主的数据分析,已经有了非常成熟和稳定的技术方案和生态系统,对于BI系统来说,大概的架构图如下:可以看到在BI系统里面,核心的模块是Cube,Cube是一个更高层的业务模型抽象,在Cube之上可以进行
2016/4/19 6:19:34 351KB 常用的几种大数据架构剖析
1
《ADO.net+VB.net数据库应用开发指南》作者:章立民编著出版日期:2004年09月第1版----------------------------本书使用130个以上短小而实用的例子,引领您攻占ADO.NET的核心领域。
详细引见ADO.NET的各个组件,为您奠下扎实根基。
演示WindowsForms的数据架构与数据连接。
演示新增、修改、删除与搜索的并行输出输入接口。
演示BLOB值的读取、写入与显示。
演示如何将数据集的更新写回数据源。
----------------------------下载内容:范例源代码及北风贸易数据库注:第四节代码已转换为VB2005
2015/8/9 15:23:27 11.35MB 章立民 ADO.net VB.net 数据库
1
“我们正在从IT时代走向DT时代(数据时代)。
IT和DT之间,不只仅是技术的变革,更是思想意识的变革,IT主要是为自我服务,用来更好地自我控制和管理,DT则是激活生产力,让别人活得比你好”——阿里巴巴董事局主席马云。
数据量从M的级别到G的级别到现在T的级、P的级别。
数据量的变化数据管理系统(DBMS)和数仓系统(DW)也在悄然的变化着。
传统应用的数据系统架构设计时,应用直接访问数据库系统。
当用户访问量增加时,数据库无法支撑日益增长的用户请求的负载时,从而导致数据库服务器无法及时响应用户请求,出现超时的错误。
出现这种情况以后,在系统架构上就采用下图的架构,在数据库和应用中间过一层缓冲隔离,缓解数
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡