这一章想讲一下Spark的缓存是如何实现的。
这个persist方法是在RDD里面的,所以我们直接打开RDD这个类。
它调用SparkContext去缓存这个RDD,追杀下去。
它竟然是用一个HashMap来存的,具体看这个map的类型是TimeStampedWeakValueHashMap[Int,RDD[_]]类型。
把存进去的值都隐式转换成WeakReference,然后加到一个内部的一个ConcurrentHashMap里面。
这里貌似也没干啥,这是有个鸟蛋用。

大神莫喷,知道干啥用的人希望告诉我一下。
现在并没有保存,等到真正运行Task运行的时候才会去缓存起来。
入口在Task的runTask方
1
第9章-Spark.pdf
2021/8/23 7:12:45 1.19MB 大数据
1
大数据hadoopsparkhbaseambari全套视频教程(购置的付费视频)
2018/10/24 2:15:10 47B 大数据 hadoop spark hbase
1
大数据hadoopsparkhbaseambari全套视频教程(购置的付费视频)
2019/1/3 7:27:21 47B 大数据 hadoop spark hbase
1
本文搜集了近年各公司大数据开发岗位的面试题,涉及Hadoop、Spark、kafka、HBASE等大数据组件相关组件
2017/5/19 21:17:32 2.87MB Spark Hadoop Kafka
1
2021贺岁大数据入门spark3.0入门到精通资源简介:本课程中使用官方在2020年9月8日发布的Spark3.0系列最新稳定版:Spark3.0.1。
共课程包含9个章节:Spark环境搭建,SparkCore,SparkStreaming,SparkSQL,StructuredStreaming,Spark综合案例,Spark多语言开发,Spark3.0新特性,Spark功能调优。
2015/8/22 23:45:22 595.06MB spark 大数据
1
大数据项目电商推荐系统经修改过的源码,已运转出来,论文可联系我获取。
免积分下载,如遇需要积分是csdn根据下载量自动累加设置的,请联系我设置免积分下载。
文章链接https://blog.csdn.net/qq_43265673/article/details/101790686
2016/1/5 17:58:57 8.09MB 大数据 Spark 机器学习 推荐系统
1
Spark是加州大学伯克利分校AMP实验室(Algorithms,Machines,andPeopleLab)开发通用内存并行计算框架。
Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处,Spark以其先进的设计理念,迅速成为社区的热门项目,围绕着Spark推出了SparkSQL、SparkStreaming、MLLib和GraphX等组件,也就是BDAS(伯克利数据分析栈),这些组件逐渐构成大数据处理一站式解决平台。
从各方面报道来看Spark抱负并非池鱼,而是希望替代Hadoop在大数据中的地位,成为大数据处理的主流标准,不过Spark还没有太多大项目的检验,离这个目标还有很大路要走。
2015/10/10 15:29:11 38.73MB spark
1
BDTC2014中国大数据技术大会超级火爆。
应大家的要求,特别将32位主要演讲专家的PDF收集、整理、分享。
内容涵盖Hadoop、YARN、Spark、HBase、Impala、Tez等开源软件的最新进展,NoSQL/NewSQL、内存计算、流计算和图计算技术的发展趋势,以及大数据下的可视化、图计算、机器学习/深度学习、商业智能、数据分析等的最新业界应用,数十家企业的实践经验。
本文将http://download.csdn.net/album/detail/1367这里的文档下载进行了汇总,节省大家的下载时间,希望对大家有用!!
2017/6/18 11:04:14 67.87MB 2014BDTC 中国大数据
1
有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的功能会比期望差很多。
数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的功能。
如果数据倾斜没有解决,完全没有可能进行功能调优,其他所有的调优手段都是一个笑话。
数据倾斜是最能体现一个spark大数据工程师水平的功能调优问题。
数据倾斜如果能够解决的话,代表对spark运行机制了如指掌。
数据倾斜俩大直接致命后果。
1数据倾斜直接会导致一种情况:OOM。
2运行速度慢,特别慢,非常慢,极端的慢,不可接受的慢。
我们以10
1
共 164 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡