亲测可用CM6.3.1对于应CDH6.3.2
2019/1/5 8:08:43 646.85MB CDH 大数据 cloudera cm6.3.1
大数据组件,官方版本:CDH5.9.0操作零碎:CentOS7/RHEL7完整系列:GPLEXTRAS-5.9.0-1.cdh5.9.0.p0.23-el7.parcelGPLEXTRAS-5.9.0-1.cdh5.9.0.p0.23-el7.parcel.sha
2016/2/4 6:40:47 41B CDH5.9.0 大数据 CDH
hadoop的jar包,曾经经Linux系统编译过的,下载后直接解压就可以用
2021/11/7 10:49:06 188.5MB hadoop
解压后,交换掉hadoop中原有的bin目录即可。
也可以尝试将hadoop.dll和winutils.exe拷贝到bin目录下,NN命令添加:可以在start-dfs.cmd和stop-dfs.cmd中分别加入启动/关闭secondarynamenode的命令:start"ApacheHadoopDistribution"hadoopsecondarynamenodeTaskkill/FI"WINDOWTITLEeqApacheHadoopDistribution-hadoopsecondarynamenode"
2016/7/25 18:28:08 950KB hadoop winutils
这是山东大学大数据实验二,用Hadoop完成文档的倒排索引
2019/5/7 9:56:13 11KB Hadoop 大数据 倒排索引
尚硅谷大数据项目之电商数仓(1用户行为数据采集),你值得拥有,欢迎一同学习和交流!!!
2017/2/21 22:55:53 4.57MB 大数据 hadoop zookeeper hive
Linux相关基础命令及配置。
(Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。
Linux能运行主要的UNIX工具软件、应用程序和网络协议。
它支持32位和64位硬件。
Linux继承了Unix以网络为核心的设计思想,是一个功能稳定的多用户网络操作系统。
2016/5/27 6:14:32 29.27MB Linux基础
大数据元数据开源处理方案apacheatlas,提供数据治理,元数据管理等功能
2018/2/11 21:51:24 9.77MB 元数据 atlas 数据治理  数据质量
使用apache-maven-3.6及各种组件编译好的包,atlas是apache旗下的元数据管理软件,可以和大部分大数据组件集成,从而管理所有数据信息的元数据,方便后续数据资产的管理,官网只存在源码文件包,此处将源码在linux系统下完成编译,方便各位使用。
可单机,可集群,本人都成功搭建过,因为搭建atlas踩过好多坑,所以晓得其中不易。
包含内嵌Hbase和solr,和各种所需hook,绝对良心资源。
2018/4/10 20:22:34 487.81MB 大数据 atlas 数据治理
对于很多企业而言,大数据的重要性不言而喻,但是如何构建、实施和应用大数据系统却是一个复杂工程。
本书让读者认识到大数据不仅仅是数据、技术、架构、应用,更是结合了商业模式、战略定位、信息安全、单位协同、组织保障、实施选型的完整体系。
本书内容从大数据的规划定位、组织实施和价值提升三个维度展开,兼顾从整体性、全局性、安全性、价值性、技术性、体系性等方面的考虑。
第一部分:企业大数据战略规划主要从宏观的角度介绍大数据的定位、组织保障、处理方案选择和自主实施思路,目的是从全局角度引导建立大数据工作的整体思维。
第二部分:企业大数据落地实施主要从执行层面介绍了大数据落地相关的技术、架构、开发、大数据工作流、应用和价值评估,直接以落地视角解读大数据工作中每个环节涉及到的流程、知识和方法,这也是本书的核心章节。
第三部分:大数据价值、变革和挑战主要涉及大数据的社会价值、当前问题和挑战以及大数据的未来趋势,这是对现有大数据工作的延展以及未来趋势的探索。
2019/4/10 18:18:23 8.19MB 大数据
共 330 条记录 首页 上一页 下一页 尾页