搜索【spark】的结果-好快吧下载

随着云时代的到来，大数据也吸引了越来越多多关注。
而Spark做为大数据处理的佼佼者，越来越受到人们的关注。
正是由于Spark技术的出现，使得在云计算上构建超大规模的大数据平台成为了可能。
Spark诞生于伯克利大学AMPLab，是现今大数据领域里最为活跃，最为热门，最为高效的大数据通用计算平台。
Spark是基于MapReduce算法实现的一个分布式计算框架，Spark继承了Hadoop的MapReduce的所有优点，但是比Hadoop更为高效。
Spark成功使用SparkSQL/SparkStreaming/MLlib/GraphX近乎完美的解决了大数据中的BatchProcessing、

2024/11/29 4:32:47 416KB 构建新一代容器云计算BigDataPlatform最佳实践

1

CoolplaySpark_lw-lin.tar.gz

《酷玩Spark:Spark源代码解析、Spark类库等》源码

2024/10/29 1:43:34 8MB spark

1

SPARK大数据处理(技术、应用与性能优化)(高清版)高彦杰著

2024/10/25 10:55:41 7.07MB Spark

1

八斗学院大数据第九期

第一阶段：这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术，以及Scala编程语言。
通过项目实践，你能快速掌握这些技术，获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。
第二阶段：这一阶段会学习FLume、Kafka、SparkStreaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术，以及大数据体系内的数据采集和数据仓库理论思想和技术实现。
通过项目实践，你能快速掌握这些技术，获得完整的大数据架构开发能力。
第三阶段：这一阶段会学习NLP文本相似度、中文分词、HMM算法、推荐算法CF、回归算法等应用与开发技术，整体认识商业项目-音乐推荐系统。
使用海量真实数据对大数据平台和算法进行应用实践，快速掌握大数据行业具有巨大价值的核心技术。
第四阶段：这一阶段会学习分类算法、聚类算法、分类算法-决策树、分类算法-SVM、神经网络+深度学习，深化前3阶段技术能力，初入机器学习领域。
通过对机器学习核心算法的强化练习，你将能完美胜任目前人才最紧缺的数据挖掘开发职位。

2024/10/13 15:34:27 128B 大数据 机器学习 数据挖掘

1

大数据入门spark3.0入门到精通八Spark-day02.rar

2021贺岁大数据入门spark3.0入门到精通资源简介：本课程中使用官方在2020年9月8日发布的Spark3.0系列最新稳定版：Spark3.0.1。
共课程包含9个章节：Spark环境搭建，SparkCore，SparkStreaming，SparkSQL，StructuredStreaming，Spark综合案例，Spark多语言开发，Spark3.0新特性，Spark性能调优。

2024/10/7 13:48:52 425.49MB 大数据 spark

1

Windows开发Spark程序环境配置说明.pdf

介绍机器学习Windows环境下开发Spark程序的配置方法，包含Java配置、Spark配置、系统环境配置，方便爱好者调试机器学习程序。

2024/9/29 22:54:13 674KB 深度机器学习 大数据 Spark

1

GoogleCloudPlatformforArchitectsDesignandmanagepowerfulcloudepub

GetacquaintedwithGCPandmanagerobust,highlyavailable,anddynamicsolutionstodrivebusinessobjectiveKeyFeaturesIdentifythestrengths,weaknessesandidealuse-casesforindividualservicesofferedontheGoogleCloudPlatformMakeintelligentchoicesaboutwhichcloudtechnologyworksbestforyouruse-caseLeverageGoogleCloudPlatformtoanalyzeandoptimizetechnicalandbusinessprocessesBookDescriptionUsingapubliccloudplatformwasconsideredriskyadecadeago,andunconventionalevenjustafewyearsago.Today,however,useofthepubliccloudiscompletelymainstream–thenorm,ratherthantheexception.Severalleadingtechnologyfirms,includingGoogle,havebuiltsophisticatedcloudplatforms,andarelockedinafiercecompetitionformarketshare.ThemaingoalofthisbookistoenableyoutogetthebestoutoftheGCP,andtouseitwithconfidenceandcompetence.Youwilllearnwhycloudarchitecturestaketheformsthattheydo,andthiswillhelpyoubecomeaskilledhigh-levelcloudarchitect.Youwillalsolearnhowindividualcloudservicesareconfiguredandused,sothatyouareneverintimidatedathavingtobuildityourself.YouwillalsolearntherightwayandtherightsituationinwhichtousetheimportantGCPservices.Bytheendofthisbook,youwillbeabletomakethemostoutofGoogleCloudPlatformdesign.WhatyouwilllearnSetupGCPaccountandutilizeGCPservicesusingthecloudshell,webconsole,andclientAPIsHarnessthepowerofAppEngine,ComputeEngine,ContainersontheKubernetesEngine,andCloudFunctionsPicktherightmanagedserviceforyourdataneeds,choosingintelligentlybetweenDatastore,BigTable,andBigQueryMigrateexistingHadoop,Spark,andPigworkloadswithminimaldisruptiontoyourexistingdatainfrastructure,byusingDataprocintelligentlyDeriveinsightsaboutthehealth,performance,andavailabilityofcloud-poweredapplicationswiththehelpofmonitoring,

2024/9/29 22:18:36 9.26MB google gcp

1

大数据技术开发环境搭建.docx

目录软件下载2安装虚拟机管理器2新建虚拟机，安装Ubuntu3锐捷校园认证下虚拟机Ubuntu的联网设置11熟悉Ubuntu系统13安装SSH、配置SSH无密码登陆20安装Java环境22安装Hadoop24Hadoop伪分布式配置25启动Hadoop26运行Hadoop伪分布式实例30启动YARN35附加教程:配置PATH环境变量37使用Eclipse编译运行MapReduce程序（Hadoop-Eclipse-Plugin，建议）38使用Eclipse打包自己的MapReduce程序51不用Hadoop-Eclipse-Plugin编写MapReduce程序54Hadoop集群安装配置教程56HBase安装56HBase伪分布式配置57HBaseShell编程实践60HBaseJAVAAPI编程实践64安装MySQL68Hive安装70Redis安装和使用74MongoDB安装和使用83Neo4j安装和使用96安装Spark103使用SparkShell编写代码104Scala独立应用编程106Java独立应用编程109使用Eclipse编写Spark应用程序（scala+sbt）112使用Eclipse编写Spark应用程序（scala）（建议）121使用Eclipse编写Spark应用程序（java+maven）123使用Eclipse编写Spark应用程序（java）128Storm安装和使用130使用Eclipse编写Storm程序（maven）134Kafka安装142Flume安装151Sqoop安装159Hama安装165使用Eclipse编写Hama应用程序168参考文献：174

2024/9/27 1:24:07 17.37MB hadoop spark storm hbase

1

双倍提升ApacheSpark排序性能

Cloudera和英特尔公司的工程师们正在通力合作，旨在使Sparkshuffle阶段具有更高的可扩展性和稳定性。
本文对相关方法的设计进行了详细描述。
区别常见的Embarrassingly Parallel系统，类似MapReduce和Apache Spark（Apache Hadoop的下一代数据处理引擎）这样的计算引擎主要区别在于对“all-to-all” 操作的支持上。
和许多分布式引擎一样，MapReduce和Spark的操作通常针对的是被分片数据集的子分片，很多操作每次只处理单个数据节点，同时这些操作所涉及到的数据往往都只存在于这个数据片内。
all-to-all操作必须将数据集看作一个

2024/9/25 10:14:06 326KB 双倍提升ApacheSpark排序性能

1

基于Hadoop大数据分析应用场景与实战

本文来自于linkedkeeper.com,本文主要介绍了一下kafka的基本概念，并结合一些实验帮助理解kafka中的一些难点，如多个consumer的容错性机制，offset管理。
为了满足日益增长的业务变化，京东的京麦团队在京东大数据平台的基础上，采用了Hadoop等热门的开源大数据计算引擎，打造了一款为京东运营和产品提供决策性的数据类产品-北斗平台。
大数据是不能用传统的计算技术处理的大型数据集的集合。
它不是一个单一的技术或工具，而是涉及的业务和技术的许多领域。
目前主流的三大分布式计算系统分别为:Hadoop、Spark和Strom：Hadoop当前大数据管理标准之一，运用在当前很多商业应

2024/8/22 17:30:33 348KB 基于Hadoop大数据分析应用场景与实战

1

钉钉无人值守自动打卡脚本永不迟到的神器安卓和苹果教程 New!

在日常工作中，钉钉打卡成了我生活中不可或缺的一部分。然而，有时候这个看似简单的任务却给我带来了不少烦恼。每天早晚，我总是得牢记打开钉钉应用，点击"工作台"，再找到"考勤打卡"进行签到。有时候因为工作忙碌，会忘记打卡，导致考勤异常，影响当月的工作评价。而且，由于我使用的是苹果手机，有时候系统更新后，钉钉的某些功能会出现异常，使得打卡变得更加麻烦。另外，我的家人使用的是安卓手机，他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说，每次打卡都是一次挑战。他们总是担心自己会操作失误，导致打卡失败。为了解决这些烦恼，我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习，我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。

2024-04-09 15:03 15KB 钉钉 钉钉打卡

个人信息

一言

热门下载

最新下载

其他资源