Hadoop快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）-伙伴云

Hadoop 快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

网友投稿 805 2022-05-28

Hadoop快速入门——第二章、分布式集群

HDFS概述:

在 2002 年，Google 发表的论文 GFS 中提到希望构建一个能够运行于商业硬件集群上的以流式数据访问形式存储超大文件的文件系统，HDFS 就是为了实现这一目标

HDFS 的设计特点如下

超大文件

流式数据访问

商用硬件

不能处理低时间延迟的数据访问

不能存放大量小文件

无法高效实现多用户写入或者任意修改文件

在 HDFS 中有一些特殊的概念，需要特别重点的理解

数据块:在普通的文件系统中，每个磁盘都有默认的数据块，这是磁盘进行数据读 / 写的最小单位

NameNode:它是 Hadoop 的 HDFS 的核心组件，它维护着文件系统树和整棵树内所有的文件和目录

DataNode: DataNode 是文件系统的工作节点，也就是数据节点，它根据存储需要检索数据块，并定期向 NameNode 发送它所存储的块的列表

SecondNameNode: SecondNameNode 是对主 NameNode 的一个补充，它会周期地执行对 HDFS 元数据的检查点

HDFS 的安全模式:在 NameNode 启动时，首先将镜像文件 fsimage 载入内存，并执行编辑日志 edits 中的各项操作

n数据完整性:在 Hadoop 系统中检测数据完整性是一个常见的措施

常用命令：

hadoop fs -mkdir

示例：

Mkdir:创建路径中的各级父目录(-p可以创建多级文件夹)

hadoop fs -mkdir -p /user/hadoop/test1

put:从本地文件系统中复制单个或多个源路径到目标文件系统。

get:复制文件到本地文件系统

hadoop fs -get /home/data/save.log newSave.log

mv:移动文件

hadoop fs -mv /home/data/save.log /user/hadoop/newSave.log

Hadoop快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

cat:输出文件内容

hadoop fs -cat /user/hadoop/newSave.log

ls:返回文件或目录列表信息

hadoop fs -ls /user/hadoop/

ls -R:递归返回文件或目录列表信息

hadoop fs -ls -R /user

touchz:创建一个 0 字节的空文件

hadoop fs -touchz /hello1.log hadoop fs -touchz /hello2.log hadoop fs -touchz /hello3.log hadoop fs -touchz /hello4.log hadoop fs -touchz /hello5.log

chown:改变文件的拥有者

vi test.sh

hadoop fs -put test.sh /home/test.sh hadoop fs -ls /home/

修改用户，可以看到从【root】改为【hadoop】

hadoop fs -chown hadoop /home/test.sh hadoop fs -ls /home/

tail :将文件尾部 1K 字节的内容输出

hadoop fs -tail /home/test.sh

rm -r:删除指定的文件

hadoop fs -rm /home/test.sh

删除后已经无法再次查看文件了。

Hadoop Shell 分布式

快速跳到我想要的那一页（怎么快速到下一页）">怎么快速跳到我想要的那一页（怎么快速到下一页）

805 2022-05-28

入门之十六操作DOM节点">WEB入门之十六操作DOM节点

805 2022-05-28

怎么在表格里快速查找名字（怎么在表格中查找名字）">怎么在表格里快速查找名字（怎么在表格中查找名字）

805 2022-05-28

Hadoop 快速 入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

快速跳到我想要的那一页（怎么快速到下一页）">怎么快速跳到我想要的那一页（怎么快速到下一页）

入门之十六操作DOM节点">WEB入门之十六操作DOM节点

怎么在表格里快速查找名字（怎么在表格中查找名字）">怎么在表格里快速查找名字（怎么在表格中查找名字）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

友情链接

Hadoop快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

微信扫一扫：分享

快速跳到我想要的那一页（怎么快速到下一页）">怎么快速跳到我想要的那一页（怎么快速到下一页）

入门之十六 操作DOM节点">WEB入门之十六 操作DOM节点

怎么在表格里快速查找名字（怎么在表格中查找名字）">怎么在表格里快速查找名字（怎么在表格中查找名字）

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

系统的功能有哪些？餐饮服务系统的构成及工作程序">连锁餐饮管理系统的功能有哪些？餐饮服务系统的构成及工

友情链接

Hadoop 快速入门——第二章、分布式集群（第三节、HDFS Shell的常用命令）

入门之十六操作DOM节点">WEB入门之十六操作DOM节点