Cloudera和英特尔公司的工程师们正在通力合作,旨在使Sparkshuffle阶段具有更高的可扩展性和稳定性。
本文对相关方法的设计进行了详细描述。
区别常见的Embarrassingly Parallel系统,类似MapReduce和Apache Spark(Apache Hadoop的下一代数据处理引擎)这样的计算引擎主要区别在于对“all-to-all” 操作的支持上。
和许多分布式引擎一样,MapReduce和Spark的操作通常针对的是被分片数据集的子分片,很多操作每次只处理单个数据节点,同时这些操作所涉及到的数据往往都只存在于这个数据片内。
all-to-all操作必须将数据集看作一个
2024/9/25 10:14:06 326KB 双倍提升ApacheSpark排序性能
1
倒排索引(InvertedIndex)被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,是目前几乎所有支持全文索引的搜索引擎都需要依赖的一个数据结构。
资源中包含了MapReduce实现的文档倒排索引的源码、jar包、测试数据(包含停词表)和结果。
2024/9/15 10:22:16 3.55MB MapRed Java Hadoop SDU
1
caibinbupt的Hadoop源码分析完整版,包括HDFS和MapReduce。
HDFS:41章MapReduce:14章
2024/8/7 0:54:18 5.99MB Hadoop 源码分析 完整版 HDFS
1
java操作hadoop之mapreduce分析年气象数据最低温度实战源码,附带所需jar包,欢迎学习。
2024/7/6 17:03:54 35.64MB hadoop实战
1
项目包含python爬虫,Matplotlib、Echarts数据可视化、Mapreduce、hive数据统计、情感分析、词图云、电影票房与评分预测。
2024/7/4 9:39:50 8.22MB python hive mapreduce 数据可视化
1
一个MapReduce简单程序示例MapReducehadoop
2024/6/15 17:27:43 1.08MB MapReduce demo hadoop
1
基于搜狗查询数据500w条使用MapReduce做数据清洗,hive做离线分析的项目,详细文档附数据连接,搜狗实验室的搜索数据下载后缺少了用户ID字段的数据,所以本分析采用的是完整的数据,大家可以放心下载,如果下载数据的百度云链接失效无法下载,大家可以给我留言。
1
文档是我整理的所有关于mapreduce实战代码,里面所有的程序都是经过我自己全部运行验证通过的,现分享出供大家参考
2024/4/20 2:22:46 320KB mapreduce
1
数据科学入门,第二版,介绍数据科学基本知识的重量级读本,Google数据科学家作品。
  数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。
本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。
  作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。
书中涵盖的所有代码和数据都可以在GitHub上下载。
  通过阅读本书,你可以:  学到一堂Python速成课;
  学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;
  掌握如何收集、探索、清理、转换和操作数据;
  深入理解机器学习的基础;
  运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;
  探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。
2024/3/25 19:37:40 4.65MB data
1
Ambari是一个基于web的工具,用于配置、管理和监视Hadoop集群,支持HDFS、MapReduce、Hive、HCatalog,、HBase、ZooKeeper、Kafka、Oozie、Pig、Sqoop和Spark等服务。
Ambari同样还提供了集群状况仪表盘,以友好的用户界面对它们的性能特性进行诊断。
2024/3/24 4:11:14 2.21MB ambari
1
共 83 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡