hdfs是一个用于存储大文件的分布式文件系统,是apache下的一个开源项目,使用java实现.它的设计目标是可以运行在廉价的设备上,运行在大多数的系统平台上,高可用,高容错,易于扩展. 适合场景 存储大文件:G级别或者以上 离线数据分析 非结构化数据 一次写多次读 不适合的场景 存储小文件 文件需要修改(hdfs只能追加,如果需要修改,删除后,再重新上传) 低延迟服务 多用户写 大量随机读 整体架构 各组件含义以及关系 组件 含义 备注 NameNode 名字节点,Master节点,仲裁者 管…