HDFS免重启挂载新磁盘

2026-01-01 09:27:30

在生产环境中，集群节点磁盘大小不同，其使用率也会不同，HDFS虽有均衡策略，但也会有数据不平衡的情况，有些节点磁盘就会被打满，然后这个节点就不健康了（Unhealthy Nodes），Yarn的磁盘阈值检查（yarn.nodemanager.disk-health-checker.min-healthy-disks），默认是90%，超过这个值就会不健康，集群有个节点不健康，就会导致任务运行缓慢，之后任务再挤压，Yarn资源被集中占用，最终影响上层服务。

问题

磁盘空间不足，待扩容，可动态增删磁盘
yarn资源不足，待优化，可动态调整

本篇内容只添加新磁盘，yarn资源优化我们在另一篇文章再专门详解。

官方说明

官方文档：DataNode Hot Swap Drive

DataNode Hot Swap Drive

Datanode supports hot swappable drives. The user can add or replace HDFS data volumes without shutting down the DataNode. The following briefly describes the typical hot swapping drive procedure:

If there are new storage directories, the user should format them and mount them appropriately.

The user updates the DataNode configuration dfs.datanode.data.dir to reflect the data volume directories that will be actively in use.

The user runs dfsadmin -reconfig datanode HOST:PORT start to start the reconfiguration process. The user can use dfsadmin -reconfig datanode HOST:PORT status to query the running status of the reconfiguration task.

Once the reconfiguration task has completed, the user can safely umount the removed data volume directories and physically remove the disks.

经过谷歌翻译如下：

DataNode 热插拔驱动器

Datanode 支持热插拔驱动器。用户可以在不关闭 DataNode 的情况下添加或替换 HDFS 数据卷。下面简要介绍典型的热插拔驱动器过程：

如果有新的存储目录，用户应该格式化它们并适当地挂载它们。

用户更新 DataNode 配置dfs.datanode.data.dir 以反映将被积极使用的数据卷目录。

用户运行dfsadmin -reconfig datanode HOST:PORT start来启动重新配置过程。用户可以使用 dfsadmin -reconfig datanode HOST:PORT status 查询重配置任务的运行状态。

重新配置任务完成后，用户可以安全地卸载已移除的数据卷目录并物理移除磁盘。

我们先说添加新的磁盘，大意就是不需要重启任何节点，在需要添加磁盘的节点上，添加好磁盘，这个需要运维操作，就是挂载一个新目录，文档中是说要配置DataNode的目录，这里我们建议加上NameNode的目录dfs.namenode.name.dir，然后再执行一个使配置生效的命令，最后查看配置状态。

具体操作

这里假设已有集群，需要加磁盘的节点为node2。运维也已经帮我们挂载好磁盘，新磁盘目录为/data2。

第一步：新增目录

在node2上添加新目录，数据目录和元数据目录

mkdir -p /data2/soft/hadoop/tmp/dfs/data

mkdir -p /data2/soft/hadoop/tmp/dfs/name

第二步：修改配置

修改节点node2的配置文件hdfs-site.xml，主要两个属性

修改前

<!--指定hdfs中namenode的存储位置-->
<property>
    <name>dfs.namenode.name.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/name</value>
</property>
<!--指定hdfs中datanode的存储位置-->
<property>
    <name>dfs.datanode.data.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/data</value>
</property>

修改后

<!--指定hdfs中namenode的存储位置-->
<property>
    <name>dfs.namenode.name.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/name,/data2/soft/hadoop/tmp/dfs/name</value>
</property>
<!--指定hdfs中datanode的存储位置-->
<property>
    <name>dfs.datanode.data.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/data,/data2/soft/hadoop/tmp/dfs/data</value>
</property>

第三步：使配置生效

重新配置DataNode的配置，使配置生效。

hdfs dfsadmin -reconfig datanode node2:50020 start

hdfs dfsadmin -reconfig datanode node2:50020 status

第四步：平衡数据

HDFS数据本身并不总是均匀的放置在DataNode中，在添加新磁盘后，我们需要重新平衡下数据，HDFS为我们提供了一个工具，可以分析数据块放的位置和跨 DataNode 重新平衡数据：balancer

官方文档：hdfs balancer

hdfs balancer
    [-threshold <threshold>]：磁盘容量百分百，判断集群是否平衡的目标参数，每一个 datanode 存储使用率和集群总存储使用率的差值都应该小于这个阀值，越小越平衡，默认10，越大平衡越快。
    [-policy <policy>]：datanode（默认）：如果每个数据节点都是平衡的，则集群是平衡的。blockpool：如果每个数据节点中的每个块池都是平衡的，则集群是平衡的。
    [-exclude [-f <hosts-file> | <comma-separated list of hosts>]]：将指定的数据节点排除在平衡器的平衡之外。
    [-include [-f <hosts-file> | <comma-separated list of hosts>]]：仅包括要由平衡器平衡的指定数据节点。
    [-idleiterations <idleiterations>]：rebalanecing server启动的线程数，默认5。

平衡前操作

在平衡时受带宽影响，每个数据节点每秒使用的最大字节数是有限的，所以我们先临时设置这个值，此值会覆盖hdfs-site.xml中dfs.datanode.balance.bandwidthPerSec的值，默认是1M，本操作命令不会持久，命令如下：

hdfs dfsadmin -setBalancerBandwidth 104857600

其他值：1024*1024=1M(1048576)，52428800=50M，104857600=100M

开始平衡

本次执行平衡命令，磁盘平衡目标数为20 nohup hdfs balancer -threshold 20 > balancer.log &

其他平衡命令

平衡所有节点 nohup hdfs balancer > balancer.log &

平衡指定节点，磁盘平衡目标数为10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 > balancer.log &

平衡指定节点，磁盘平衡目标数，启动线程数为10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 -idleiterations 10 > balancer.log &

注（可选）：一般在平衡时，可以先停止存储比较高的节点上的NodeManager，这样在该节点上就不会受本地NodeManager落数据到本地，使得本地存储迅速增加的影响。

yarn-daemon.sh stop nodemanager yarn-daemon.sh start nodemanager

更多关于HDFS免重启挂载新磁盘的文章请查看下面的相关链接

HDFS-Hadoop NameNode高可用机制

目录 1 - 为什么要高可用 2 - NameNode 的高可用发展史 3 - HDFS 的高可用架构 3.1 Standby 和 Active 的命名空间保持一致 3.2 同一时刻只有一个 Active NameNode 4 - HDFS 高可用的实现原理 4.1 隔离(Fencing)- 预防脑裂 4.2 Qurom Journal Manager 共享存储 5 - 其他补充 5.1 QJM 的 Fencing 方案 5.2 - HDFS 高可用组件简介 5.2.1 ZKFailoverCo
Java访问Hadoop分布式文件系统HDFS的配置说明

配置文件 m103替换为hdfs服务地址. 要利用Java客户端来存取HDFS上的文件,不得不说的是配置文件hadoop-0.20.2/conf/core-site.xml了,最初我就是在这里吃了大亏,所以我死活连不上HDFS,文件无法创建.读取. <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <co
Hadoop 分布式存储系统 HDFS的实例详解

HDFS是Hadoop Distribute File System 的简称,也就是Hadoop的一个分布式文件系统. 一.HDFS的优缺点 1.HDFS优点: a.高容错性 .数据保存多个副本 .数据丢的失后自动恢复 b.适合批处理 .移动计算而非移动数据 .数据位置暴露给计算框架 c.适合大数据处理 .GB.TB.甚至PB级的数据处理 .百万规模以上的文件数据 .10000+的节点 d.可构建在廉价的机器上 .通过多副本存储,提高可靠性 .提供了容错和恢复机制 2.HDFS缺点 a.低延迟数
hadoop格式化HDFS出现错误解决办法

hadoop格式化HDFS出现错误解决办法报错信息: host:java.net.UnknownHostException: centos-wang: centos-wang: unknown error 在执行hadoop namenode -format命令时,出现未知的主机名. 问题原因: 出现这种问题的原因是Hadoop在格式化HDFS的时候,通过hostname命令获取到的主机名与/etc/hosts文件中进行映射的时候,没有找到. 解决方案: 1.修改/etc/hosts内容 2.
Hadoop源码分析五hdfs架构原理剖析

目录 1. hdfs架构如果在hadoop配置时写的配置文件不同,启动的服务也有所区别 namenode的下方是三台datanode. namenode左右两边的是两个zkfc. namenode的上方是三台journalnode集群. 2. namenode介绍 namenode作为hdfs的核心,它主要的作用是管理文件的元数据文件与块的对应关系中的块 namenode负责管理hdfs的元数据 namenode的数据持久化,采用了一种日志加快照的方式最后还会有一个程序读取这个快照文件和日
hadoop的hdfs文件操作实现上传文件到hdfs

hdfs文件操作操作示例,包括上传文件到HDFS上.从HDFS上下载文件和删除HDFS上的文件,大家参考使用吧复制代码代码如下: import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*; import java.io.File;import java.io.IOException;public class HadoopFile { private Configuration conf =null
Python API 操作Hadoop hdfs详解

http://pyhdfs.readthedocs.io/en/latest/ 1:安装由于是windows环境(linux其实也一样),只要有pip或者setup_install安装起来都是很方便的 >pip install hdfs 2:Client--创建集群连接 > from hdfs import * > client = Client("http://s100:50070") 其他参数说明: classhdfs.client.Client(url, ro
hadoop重新格式化HDFS步骤解析

了解Hadoop的同学都知道,Hadoop有两个核心的组成部分,一个是HDFS,另一个则是MapReduce,HDFS作为Hadoop的数据存储方案,MapReduce则提供计算服务:同时,HDFS作为一种分布式文件系统,它的安装也是需要相应的格式化操作的,如果安装失败或者我们需要重新安装的时候,那我们就需要对HDFS重新进行格式化,这篇文章就和大家一起讨论下如何进行HDFS的重新格式化. 重新格式化hdfs系统的方法: 1.打开hdfs-site.xml 我们打开Hadoop的hdfs-sit
HDFS免重启挂载新磁盘

在生产环境中,集群节点磁盘大小不同,其使用率也会不同,HDFS虽有均衡策略,但也会有数据不平衡的情况,有些节点磁盘就会被打满,然后这个节点就不健康了(Unhealthy Nodes),Yarn的磁盘阈值检查(yarn.nodemanager.disk-health-checker.min-healthy-disks),默认是90%,超过这个值就会不健康,集群有个节点不健康,就会导致任务运行缓慢,之后任务再挤压,Yarn资源被集中占用,最终影响上层服务. 问题磁盘空间不足,待扩容,可动态增删磁盘
Linux云服务器挂载新磁盘的方法步骤

背景公司内新增一台服务器, 挂载一个2T的硬盘, ssh登陆后发现没挂载, 处理一下. (不想每次都去百度怎么挂载, 还是整理一下) 查看状态 # 查看磁盘状态, 发现有一块新磁盘 /dev/vdb fdisk -l Disk /dev/vda: 42.9 GB, 42949672960 bytes 255 heads, 63 sectors/track, 5221 cylinders Units = cylinders of 16065 * 512 = 8225280 bytes Secto
详解如何在 CentOS 7 中添加新磁盘而不用重启系统

对大多数系统管理员来说扩充 Linux 服务器的磁盘空间是日常的工作之一.因此这篇文章会通过使用 Linux 命令,在 CentOS 7 系统上演示一些简单的操作步骤来扩充您的磁盘空间而不需要重启您的生产服务器.关于扩充和增加新的磁盘到 Linux 系统,我们会提及多种方法和多种可行性,可按您所需选择最适用的一种. 1. 在虚拟机客户端扩充磁盘空间: 在为 Linux 系统增加磁盘卷之前,您首先需要添加一块新的物理磁盘,或在 VMware vShere.VMware 工作站以及你使用的其它虚拟环
shell脚本快速创建、格式化、挂载新添加的磁盘实现方法

一.通过管理员选择创建.格式化.挂载新添加的磁盘脚本 #! /bin/bash echo "==============================" PS3="chose which disk you want to create:" select W in `ls /dev/sd*|grep -o 'sd[b-z]'|uniq` quit do case $W in sda) fdisk -l /dev/sda break;; sd[b-z]) echo &
CentOS7挂载新数据盘的完整步骤

前言刚刚买了一台新的VPS,新买的VPS的数据盘默认没有挂载到系统上,需要我们自己来挂载的.我们给服务器添加新的硬盘的时候都需要进行挂载操作,本文简要记录挂载操作过程. 查看硬盘信息首先我们使用命令df -TH查看当前系统挂载的情况: 我们看到并没有挂载新的数据盘,数据盘是200多G的. 然后通过命令fdisk-l查看硬盘信息. 可以看到有两块硬盘/dev/xvda和/dev/xvde,启动xvda是系统盘,xvde是我们新增的数据盘.也就是说系统发现了新增的数据盘/dev/xvde,但并没
阿里云CentOS挂载新数据盘的方法

在阿里云 Linux 服务器下挂载新的数据盘和自己本机 Linux 环境挂载新硬盘基本是一样的,基本上步骤包括:查看硬盘标识,分区,格式化,挂载等.本文记录下在阿里云 CentOS 服务器下安装和挂载新的数据盘的详细命令和步骤. fdisk -l 查看磁盘列表 [[email protected] /]# fdisk -l 磁盘 /dev/vda:42.9 GB, 42949672960 字节,83886080 个扇区 Units = 扇区 of 1 * 512 = 512 bytes 扇区大小
详解Linux下挂载新硬盘方法

Linux的硬盘识别: 一般使用"fdisk -l"命令可以列出系统中当前连接的硬盘设备和分区信息.新硬盘没有分区信息,则只显示硬盘大小信息. 1.关闭服务器加上新硬盘 2.启动服务器,以root用户登录 3.查看硬盘信息 #fdisk -l Disk /dev/sda: 42.9 GB, 42949672960 bytes 255 heads, 63 sectors/track, 5221 cylinders Units = cylinders of 16065 * 512 = 8
linux挂载新硬盘过程分享

复制代码代码如下: fdisk –l ----------------------------------------------------------------------------Disk /dev/sda: 10.7 GB, 10737418240 bytes255 heads, 63 sectors/track, 1305 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesDisk identifier: 0x000
php控制linux服务器常用功能关机重启开新站点等

php 里面有个 system 方法, 可以调用系统命令. 先建立一个脚本(比喻 /root/reboot_server.sh ),重启用的. 复制代码代码如下: #!/bin/bash reboot 再给他赋予权限 4755 chown root:root /root/reboot_server.sh chmod 4755 /root/reboot_server.sh chmod 4777 /sbin/reboot 再在 php 里, 想办法做如下调用复制代码代码如下: <?php sy
centos7云主机系统下挂载磁盘的方法

一.准备 centos7云主机一台 50G云硬盘云硬盘挂载到云主机上二.挂载磁盘 1.1查看新磁盘 [root@cgsl ]# fdisk –l 找到新添加的磁盘的编号为/dev/vdc 1.2硬盘分区进入fdisk模式 [root@cgsl ]# /sbin/fdisk /dev/vdc 输入n进行分区 [root@cgsl ]# Command (m for help): n 选择分区类型 [root@cgsl ]# Select (default p): p 选择分区个数 [roo