Druid:为OLAP而生,多快好省高。
•多,可以处理海量的数据,Druid官网说可以扩展到PB级,这个量非常大。
•快,亚秒级响应,官网说10亿量级下做到亚秒响应,我们实际应用也是亚秒响应,实时导入,导入即可查询。
导入了以后我们就可以查询到,这个还是非常非常的牛的。
•好,就是高可用,分布式容错架构,可以做到无宕机。
•省,采用列存储,高效压缩。
我举一下我们的例子,我们原始日志是10亿量级,我们选取16个维度,22个度量值,每天生成的索引是几百兆。
•高,它支持高并发,可以是作为面向用户的应用
2023/12/1 11:23:02 266KB Druid 实时 OLAP 数据仓库架构
用matlab的SpTool分析声音,并且设计滤波器的阶数,用CCS实现声音中噪音的滤除
2023/12/1 2:36:30 1019B 滤波
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。
全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,第Ⅱ部分介绍MapReduce,第Ⅲ部分介绍Hadoop的运维,第Ⅳ部分介绍Hadoop相关开源项目,第Ⅴ部分提供了三个案例
2023/11/30 19:30:03 199.43MB hadoop 权威指南,
这张图片详细的描述了kafka、和storm的过程。




2023/11/30 16:24:29 132KB kafka storm
版权归作者所有,任何形式转载请联系作者。
作者:Tommy(来自豆瓣)来源:https://book.douban.com/review/8367790/本书内容对应的Jupyternotebook放在GitHub上。
https://github.com/jakevdp/PythonDataScienceHandbook
2023/11/30 2:55:01 26.17MB Python
基于PCL写的一个删除点云数据中的重复点的程序,也可以稍作修改删除数组中的重复点。
目前测试一个四千万个点的点云数据,其中包含有一千万个重复点,运行时间为50s。
文件中是源码,其中包含CMakeLists.txt,可通过配置pcl后直接使用,也可直接复制代码使用
2023/11/27 5:33:57 2KB Pcl 点云数据 重复点删除
该版本是hadoop-2.7.1请选择对应版本,本人测试可以使用,直接解压配置环境变量,并添加hadoop.dir.home变量即可
2023/11/26 12:26:08 993KB hadoop winutils.exe hadoop.dll
用来分析文章中出现的词汇频率,多种图标和百分比可以选择
2023/11/25 15:12:54 16.65MB 外语学习 词频 数据分析 语言学
Spark面试【梅峰谷】系列整理,6大部分,200道左右面试题。
2023/11/25 1:17:35 818KB Spark 面试
2.资料-史上最全面的hadoop.rar
2023/11/23 18:17:08 319.54MB 大数据
共 1000 条记录 首页 上一页 下一页 尾页