Druid是一个为大型(设计为PB级别)数据集上实时探索查询而设计的开源数据分析和存储系统,提供极具成本效益并且永远在线(24x7x365x10)的实时数据摄取和任意数据处理,并且在面对代码部署、机器故障以及其他意外情况时能保证系统集群正常运行。
Druid自发布以来,Github上代码的活跃度一直很高,已经有很多组织和个人参与到该项目的开发中来。
因此Druid在过去的一年多时间里一直保持着很高的版本发布频次。
截至本文译本完成时,Druid已经释放出0.8.0的稳定版本,该版本在集群的稳定性和查询功能上已经有了相当的提升,同时也提供了“简单的”界面支持。
本文是Druid官方提供的论文(WhitePaper)的中文译版,主要介绍Druid的核心概念和架构设计原理。
由于目前Druid相关的文字资料相当稀少,除了其官方提供的一些指导文档,本文也是最珍贵的文字资料之一。
2021/1/8 20:12:47
1.52MB
Druid
1