基于ApacheKylin构建大数据分析平台,解决Hadoop查询速度的问题,做到亚秒级的查询速度
2024/10/27 20:35:38 89.86MB kylin
刘鹏博士精品大数据配套PPT,包含全部的大数据知识架构,适合入门、提高的人群,能帮助你快速掌握大数据相关知识。
2024/10/19 22:45:22 81.81MB 大数据
课程简介:某购物电商网站数据分析平台,分为收集数据、数据分析和数据展示三大层面。
其中数据分析主要依据大数据Hadoop生态系统常用组件进行处理,此项目真实的展现了大数据在企业中实际应用。
课程内容(1)文件收集框架Flume①Flume设计架构、原理(三大组件)②Flume初步使用,实时采集数据③实际案例:使用Flume监控数据,实时收集存储HDFS中(2)大数据分析平台架构①数据平台三大模块让技术产生价值!②分析平台业务数据③大数据平台技术选型和搭建配置测试(3)数据分析平台七大业务分析①具体的七大业务分析,针对不同的数据②将数据收到HDFS/Hive/HBase,使用MapReduce和Hive离线分析,其中涉及地域分析、用户相关信息分析及外链分析等。
③依据业务深入MapReduce使用④数据处理时,针对不同问题如何优化调整等
2024/10/9 9:38:49 889B Hadoop
这是hadoop权威指南的第4版,是中文的,想要学习大数据有关hadoop的同学可以下载
2024/10/6 11:23:58 187.87MB hadoop
本教程利用商业化的Ambari平台搭建hadoop集群环境
2024/10/6 7:55:20 327KB Ambari Hadoop 大数据 集群
根据豆瓣所有的电影,分析各国各地区各类别时间年份评分数量等各个参数之间的联系,大体上进行分析,主要比较世界电影和中国,以及中国大陆和中国港台电影之间的差别,分析各参数之间是否存在关联性及对评分产生的影响;
数据来源于豆瓣,我对评分不做主观表现,我只对数据进行分析展示,能力偏弱,但图像不弱。
2024/9/21 13:45:24 10.63MB 数据分析 python
[Raydata]是腾讯云与RayKITETec.联合开发的数据交互可视化系统Å依托腾讯海量数据积累和精准有效的计算结果,集成RayKITETec.数据可视化与实时交互等当今前沿的技术为一体所开发的大数据可视交互体统Å
2024/9/18 21:17:33 9.22MB 腾讯 大数据 可视交互系统
倒排索引(InvertedIndex)被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,是目前几乎所有支持全文索引的搜索引擎都需要依赖的一个数据结构。
资源中包含了MapReduce实现的文档倒排索引的源码、jar包、测试数据(包含停词表)和结果。
2024/9/15 10:22:16 3.55MB MapRed Java Hadoop SDU
网站日志.log文件,用来做大数据的测试,一共是好几个.log文件
2024/9/5 10:56:50 21.59MB .log文件
最新大数据培训视频,从linux基础到hadoop整个全套视频培训做到绝对0基础到项目实战,包含多个项目实战。
视频无加密,看完希望回来好评,谢谢
2024/8/30 6:32:57 67B hadoop spark
共 321 条记录 首页 上一页 下一页 尾页