上传者: weixin_38586942
|
上传时间:2018/1/3 17:07:13
|
文件大小:293KB
|
文件类型:PDF
HDFS知识点总结
本文来自于cnblogs,文章主要引见了什么是HDFS,命令行接口,Java接口,数据流,通过Flume和Sqoop导入数据,通过distcp并行复制等相关。
学习完Hadoop权威指南有一段时间了,现在再回顾和总结一下HDFS的知识点。
HDFS是什么:HDFS即Hadoop分布式文件系统(HadoopDistributedFilesystem),以流式数据访问模式来存储超大文件,运行于商用硬件集群上,是管理网络中跨多台计算机存储的文件系统。
HDFS不适合用在:要求低时间延迟数据访问的应用,存储大量的小文件,多用户写入,任意修改文件。
HDFS数据块:HDFS上的文件被划分为块大小的多个分块,作为
本软件ID:15448803