Hadoop--Secondary NameNode工作机制,作用及与NameNode HA的区别

news/2025/2/25 7:10:17

  Secondary NameNode 主要用于辅助 NameNode 进行元数据的管理和检查点(Checkpoint)的生成。

1. Secondary NameNode 的工作机制详解

Secondary NameNode 的工作机制可以分为以下步骤:

① Secondary NameNode 询问 NameNode 是否需要 Checkpoint

Secondary NameNode 会定期(由 dfs.namenode.checkpoint.period 和 dfs.namenode.checkpoint.txns 配置决定)向 NameNode 发送请求,询问是否需要执行 Checkpoint。

NameNode 会根据 edits 日志的大小和操作数量决定是否需要 Checkpoint。

② Secondary NameNode 请求执行 Checkpoint

如果 NameNode 决定执行 Checkpoint,Secondary NameNode 会向 NameNode 发送 Checkpoint 请求。

③ NameNode 滚动正在写的 edits 日志

NameNode 停止向当前的 edits 日志文件写入新的操作,并创建一个新的 edits 日志文件用于记录后续操作。

旧的 edits 日志文件被标记为只读,并重命名为一个普通的 edits 日志文件。

④ 将滚动前的编辑日志和镜像文件拷贝到 Secondary NameNode

NameNode 将滚动前的 edits 日志文件和当前的 fsimage 文件拷贝到 Secondary NameNode。

⑤ Secondary NameNode 加载编辑日志和镜像文件到内存,并合并

Secondary NameNode 将拷贝的 edits 日志文件和 fsimage 文件加载到内存中。

将 edits 日志中的操作应用到 fsimage 上,生成一个新的、包含最新元数据的 fsimage 文件。

⑥ 生成新的镜像文件 fsimage.chkpoint

Secondary NameNode 将合并后的元数据写入一个新的 fsimage 文件(如 fsimage.chkpoint)。

⑦ 拷贝 fsimage.chkpoint 到 NameNode

Secondary NameNode 将生成的 fsimage.chkpoint 文件拷贝回 NameNode。

⑧ NameNode 将 fsimage.chkpoint 重新命名成 fsimage

NameNode 将 fsimage.chkpoint 重命名为 fsimage,替换旧的 fsimage 文件。

  同时,NameNode 会删除已经合并的 edits 日志文件,因为它们的操作已经被应用到新的 fsimage 中。

(1) 那么,什么是 edits 日志?

  在 HDFS 中,NameNode 负责管理文件系统的元数据(如文件目录结构、文件块信息等)。为了保证元数据的一致性,NameNode 会将所有的元数据修改操作(如创建文件、删除文件等)记录到一个称为 edits 日志 的文件中。

  • edits 日志:是一个追加写的日志文件,记录了所有对元数据的修改操作。
  • fsimage:是元数据的完整镜像文件,记录了某一时刻文件系统的完整状态。

  由于 edits 日志会不断增长,为了避免日志文件过大,HDFS 会定期将 edits 日志中的操作合并到 fsimage 中,这个过程称为 Checkpoint。

(2) “滚动正在写的 edits 日志”具体是怎样的?

  在 Secondary NameNode 执行 Checkpoint 的过程中, “滚动正在写的 edits 日志” 主要是如下过程:

  • 停止当前正在写的 edits 日志文件:NameNode 会停止向当前的 edits 日志文件(如 edits_inprogress_001)写入新的元数据修改操作。
  • 创建一个新的 edits 日志文件:NameNode 会创建一个新的 edits 日志文件(如 edits_inprogress_002),用于记录后续的元数据修改操作。
  • 将旧的 edits 日志文件标记为只读:停止写入的 edits 日志文件(如 edits_inprogress_001)会被标记为只读,并重命名为一个普通的 edits 日志文件(如 edits_001)。

  这个过程称为 日志滚动(Log Rolling),目的是将当前的 edits 日志文件冻结,以便 Secondary NameNode 可以安全地将其拷贝走并进行合并操作。

(3) 为什么需要滚动 edits 日志呢?

  滚动 edits 日志的目的是为了确保 Checkpoint 的一致性。

  • 避免数据丢失:在 Checkpoint 过程中,NameNode 仍然会接收客户端的元数据修改请求。如果不滚动日志,新的修改操作会继续写入旧的 edits 日志文件,导致 Secondary NameNode 无法确定哪些操作已经处理,哪些操作还未处理。
  • 确保一致性:通过滚动日志,NameNode 可以确保 Secondary NameNode 拷贝的 edits 日志文件是完整的、一致的,不会包含未完成的修改操作。

(4) 如果 NameNode 元数据丢失,能否从 Secondary NameNode 恢复?

  可以恢复部分元数据。Secondary NameNode 保存了上一次 Checkpoint 的 fsimage 和 edits 日志文件,可以恢复上一次 Checkpoint 时的元数据。
  无法恢复全部元数据。从上一次 Checkpoint 到 NameNode 崩溃期间,NameNode 可能接收了新的元数据修改请求,这些请求记录在 NameNode 正在写的 edits 日志文件中。由于这些 edits 日志文件没有被拷贝到 Secondary NameNode,因此这部分元数据无法恢复。

2. Secondary NameNode 的核心作用

(1) 定期合并 fsimage 和 edits 日志

  • fsimage:是 NameNode 中元数据的完整镜像文件,记录了文件系统的某一时刻的完整状态(如文件目录结构、文件块信息等)。
  • edits 日志:记录了所有对元数据的修改操作(如创建文件、删除文件等),是一个不断追加写的日志文件。

随着时间的推移,edits 日志文件会变得非常大,导致以下问题:

  • NameNode 启动时间变长:NameNode 启动时需要将 fsimage 加载到内存,并重放 edits 日志中的所有操作,edits 日志越大,启动时间越长。
  • 内存占用增加:edits 日志中的操作需要加载到内存中,可能导致 NameNode 内存不足。

  Secondary NameNode 的作用就是定期将 edits 日志中的操作合并到 fsimage 中,生成一个新的 fsimage 文件,从而减少 edits 日志的大小,优化 NameNode 的性能。

(2) 生成检查点(Checkpoint)

  Secondary NameNode 会定期(由配置参数 dfs.namenode.checkpoint.period 和 dfs.namenode.checkpoint.txns 决定)触发 Checkpoint 过程。
  在 Checkpoint 过程中,Secondary NameNode 会从 NameNode 获取当前的 fsimage 和 edits 日志文件,将它们加载到内存中,合并生成一个新的 fsimage 文件。
  新的 fsimage 文件会被传回 NameNode,替换旧的 fsimage 文件,同时删除已经合并的 edits 日志文件。

3. Secondary NameNode 的局限性

  尽管 Secondary NameNode 在元数据管理中起到了重要作用,但它并不是 NameNode 的高可用(HA)解决方案,存在以下局限性:

(1)不能实时备份元数据

  Secondary NameNode 只是定期合并 fsimage 和 edits 日志,生成新的 fsimage 文件,并不能实时备份 NameNode 的元数据。

(2)无法完全恢复元数据

  如果 NameNode 崩溃,Secondary NameNode 只能提供上一次 Checkpoint 的元数据,无法恢复从上一次 Checkpoint 到崩溃期间的数据(这些数据记录在 NameNode 正在写的 edits 日志文件中)。

(3)不是高可用组件

  Secondary NameNode 并不能接管 NameNode 的工作,它只是一个辅助工具。

4. Secondary NameNode 与高可用(HA)方案的区别

  在 Hadoop 2.x 及更高版本中,引入了 NameNode 高可用(HA) 方案,通过以下方式解决 Secondary NameNode 的局限性:

(1)Active NameNode 和 Standby NameNode

  两个 NameNode 同时运行,一个处于 Active 状态,负责处理客户端请求;另一个处于 Standby 状态,实时同步 Active NameNode 的元数据。

(2)共享存储(如 QJM 或 NFS)

  Active NameNode 将 edits 日志写入共享存储,Standby NameNode 从共享存储读取 edits 日志并应用到自己的内存中,保持元数据的实时同步。

(3)故障切换

  如果 Active NameNode 崩溃,Standby NameNode 会立即接管工作,确保系统的高可用性。


http://www.niftyadmin.cn/n/5865142.html

相关文章

为什么java从json中获取值有数据类型,而从xml中获取值没有数据类型?

在 Java 中处理 JSON 和 XML 数据时,表面上看起来从 JSON 中获取的值具有数据类型,而从 XML 中获取的值没有,但实际上这是由 JSON 和 XML 的本质特点决定的。 JSON 的本质特点 语法结构:JSON(JavaScript Object Notation)是基于键值对的文本格式,结构清晰,适合表示数据…

首次使用WordPress建站的经验分享(一)

之前用过几种内容管理系统(CMS),如:dedeCMS、phpCMS、aspCMS,主要是为了前端独立建站,达到预期的效果,还是需要一定的代码基础的,至少要有HTML、Css、Jquery基础。 据说WordPress 是全球最流行的内容管理系统CMS,从现在开始记录一下使用WordPress 独立建站的步骤 选购…

VSCODE 终端执行PNPM 命令出错

1、编译错误 错误提示: pnpm : 无法加载文件 C:\Users\AppData\Roaming\npm\pnpm.ps1 在终点命令行执行:get-ExecutionPolicy 如果显示 Restricted 执行命令:Set-ExecutionPolicy -Scope CurrentUser RemoteSigned 修改后:…

Web Worker终极优化指南:4秒卡顿→0延迟的实战蜕变

💡 导读:从4秒卡顿到丝滑响应 真实痛点场景:当斐波那契数列计算量达10亿次时,页面完全冻结4.2秒!通过Web Worker优化后,UI响应时间降至16ms以内。本文手把手带您实现性能蜕变! 一、Web Worker核…

深度优先搜索(DFS)在 Spark 中的应用与实现

深度优先搜索(DFS)在 Spark 中的应用与实现 深度优先搜索(Depth-First Search, DFS)是一种经典的图遍历算法,广泛应用于图论、路径搜索、连通性检测等场景。在 Spark 中,DFS 可以用于处理图数据&#xff0…

在 MySQL 的 InnoDB 存储引擎中,部分数据库优化策略

在 MySQL 的 InnoDB 存储引擎中,以下操作是 同步的,并且会直接影响数据库执行 SQL 的效率: 1. Redo Log 的同步刷盘(事务提交时) 触发条件: 当 innodb_flush_log_at_trx_commit1 时,事务提交时强…

GreatSQL修改配置文件参数无法生效

GreatSQL修改配置文件参数无法生效 一、问题描述 客户需要创建无主键表,因提供默认模板设置了参数sql_require_primary_key ON(创建新表或更改现有表结构的语句强制要求表具有主键),当创建无主键表时会提示ERROR 3750 (HY000):…

4. Spring Cloud Gateway 入门与使用

一、什么是网关? 网关是一种网络设备,用于连接两个或多个不同网络,将数据从一个网络转发到另一个网络。它充当了两个网络之间的桥梁,负责转发数据并处理来自不同网络的通信协议转换。 二、网关有什么用? 网关的主要作用有以下几个: 路由…