图文详解 HDFS 组成框架-伙伴云

网友投稿 1054 2022-05-28

HDFS是Google公司的 GFS论文思想的实现，它由NameNode（名称节点）、DataNode（数据节点）、SecondaryNameNode（第二名称节点）组成。其中， NameNode 相当于论文中的 GFS Master ， DataNode 相当于论文中的 GFS Chunk Server 。

GFS 是一个可扩展的分布式文件系统设计思想，用于设计针对大型的、分布式的、对大量数据进行访问的文件系统。

一、 HDFS简介

HDFS是基于流数据访问模式的分布式文件系统，其设计建立在 “一次写入、多次读取” 的基础上，提供高吞吐量、高容错性的数据访问，能很好地解决海量数据的存储问题。

流数据是指数千个数据源持续生成的数据，可以理解为随时间延续而无限增长的动态数据集合。

通俗点说，如果把数据比如成一个水库，那么流进去的水，就是流数据（就像我们听的音乐，属于音乐流；而看到的文字、图片这些较为固定的，一次性下载的，形成不了流）。

在Hadoop生态圈中，HDFS属于底层基础，负责存储文件。

~（图片来源于网络）~

HDFS的优点：

高容错性。提供了容错和恢复机制，副本丢失后，自动恢复。

高可靠性。数据自动保存多个副本，通过多副本提高可靠性。

适合大数据处理。可以处理超大文件，比如 TB级甚至PB级的文件。

适合批处理。移动计算而非移动数据；数据位置暴露给计算框架。

支持流式数据访问。一次性写入，多次读取（一个数据集一旦生成，就会被复制分发到不同的存储节点，各节点可以进行读取/访问）；保证数据一致性。

低成本运行。可以运行在低成本的硬件之上。

…

HDFS 默认保存 3 份副本。

第一个副本：放置在上传文件的数据节点（第一个副本如果是在集群外提交，则随机挑选一个 CPU 比较空闲、磁盘不太满的节点）；

第二个副本：放置在与第一个副本不同的机架的节点上；

第三个副本：放在与第二个副本相同的机架的其他节点上。

HDFS的缺点：

不适合处理低延迟的数据访问。比如用户要求时间比较短的低延迟应用（主要处理高数据吞吐量的应用）。

不适合处理大量的小文件。会造成寻址时间超过读取时间；会占用NameNode大量内存，因为NameNode把文件系统的元数据存放在内存中（文件系统的容量由NameNode的大小决定），小文件太多会消耗NameNode的内存。

不适合并发写入。一个文件只能有一个写入者，HDFS暂不支持多个用户对同一个文件的写操作。

不适合任意修改文件。仅支持append(附加)，不支持在文件的任意位置进行修改。

…

二、 HDFS的组成与架构

HDFS的组成架构图及各部分功能如下所示：

~（图片来源于网络）~

当用户访问数据文件时，为了保证能够读取到每一个数据块， HDFS有一个专门负责保存文件属性信息的节点，这个节点就是 NameNode 节点（即名称节点）。

NameNode节点是HDFS的管理者，负责保存和管理HDFS的元数据。

其职责有以下三个方面：

① 管理维护HDFS的命名空间

NameNode管理HDFS系统的命名空间，维护文件系统树以及文件系统树中所有文件的元数据。管理这些信息的的文件分别是 edits（操作日志文件）和 fsimage（命名空间镜像文件）。

editlog(操作日志)：在NameNode启动的情况下，对HDFS进行的各种操作进行记录。（HDFS客户端执行的所有操作都会被记录到editlog文件中，这些文件由edits文件保存）

fsimage：包含HDFS中的元信息（比如修改时间、访问时间、数据块信息等）。

② 管理DataNode上的数据块

负责管理数据块上所有的元数据信息（管理DataNode上数据块的均衡，维持副本数量）。

③ 接收客户端的请求

接收客户端文件上传、下载、创建目录等的请求。

HDFS首先把大文件切分成若干个小的数据块，再把这些数据块写入不同的节点，这个负责保存文件数据的节点就是 DataNode 节点（即数据节点）。

DataNode节点负责存储数据，把Block(数据块)以Linux文件的形式保存在磁盘上，并根据Block标识和字节范围来读写块数据。

其职责有以下三个方面：

① 保存数据块

一个数据块会在多个DataNode进行冗余备份（在某一个DataNode最多只有一个备份）。

② 负责客户端对数据块的IO请求

在客户端执行写操作时，DataNode之间会相互通信，保证写操作的一致性。

③ 定期和NameNode进行心跳通信，接受NameNode的指令

如果NameNode节点10分钟没有收到DataNode的心跳信息，就会将其上的数据块复制到其他DataNode节点。

因此，NameNode节点上并不会永久保存DataNode节点上的数据块信息，而是通过与DataNode节点心跳联系的方式，来更新节点上的映射表，以此减轻负担。

问题：HDFS数据块默认大小为128M（Hadoop2.2之前为64M），将HDFS的数据块设置得很大的目的是什么？（传统数据块只有512个字节）

答：为了减少寻址开销，让HDFS的文件传输时间由传输速率决定（如果块设置得足够大，从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间）。

HDFS有一个定期创建命名空间的检查点(CheckPoint)操作的节点，也就是SecondaryNameNode节点（即第二名称节点）。

出于可靠性考虑，SecondaryNameNode节点与NameNode节点通常运行在不同的机器上，且SecondaryNameNode节点与NameNode节点的内存要一样大。

（如果想了解 SecondaryNameNode 的工作流程，可以参考这篇文章：浅析 SecondaryNameNode 的工作流程）

问题：一般情况下，一个集群中的SecondaryNameNode节点也是只有一个的原因是什么？

答：因为如果多的话，会增加NameNode的压力，使其忙于元数据的传输/接收、日志的传输/切换，从而导致性能下降；同时，NameNode节点也不支持做并发检查点。

SecondaryNameNode节点定期把NameNode的 fsimage 和 edits 下载到本地，再将它们加载到内存并进行合并，最后把合并后新的 fsimage 返回NameNode （这个过程称为检查点）。

经典问题：NameNode与SecondaryNameNode有没有关系？

SecondaryNameNode节点的工作流程可以参考这篇文章：

其职责有以下两个方面：

① 防止edits过大

定期合并 fsimage 和 edits 文件，使 edits 大小保持在限制范围内。这样做减少了重新启动NameNode时合并 fsimage 和 edits 耗费的时间，从而减少了NameNode启动的时间。

② 做冷备份

对一定范围内数据做快照性备份，在NameNode失效时能恢复部分 fsimage 。

好了，HDFS 及其组成框架介绍完成。

如果想进一步了解 HDFS 的工作机制，可以参考这篇文章：图文详解 HDFS 工作机制及其原理。

Hadoop 分布式大数据

HDFS中的Python 和JavaAPI">三、HDFS中的Python 和JavaAPI

1054 2022-05-28

面向对象编程 详解">JavaScript面向对象编程 详解

1054 2022-05-28

异步编程Ajax的详解，并对其进行封装整理">异步编程Ajax的详解，并对其进行封装整理

1054 2022-05-28

图文 详解 HDFS 组成框架

HDFS中的Python 和JavaAPI">三、HDFS中的Python 和JavaAPI

面向对象编程 详解">JavaScript面向对象编程 详解

异步编程Ajax的详解，并对其进行封装整理">异步编程Ajax的详解，并对其进行封装整理

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

定制订单管理系统（为特定需求定制的订单管理系统）

友情链接

图文详解 HDFS 组成框架

微信扫一扫：分享

HDFS中的Python 和JavaAPI">三、HDFS中的Python 和JavaAPI

面向对象编程详解">JavaScript面向对象编程详解

异步编程Ajax的详解，并对其进行封装整理">异步编程Ajax的详解，并对其进行封装整理

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

友情链接