首页 理论教育 Hadoop2.0新特性:高可用性(HA)

Hadoop2.0新特性:高可用性(HA)

时间:2023-06-24 理论教育 版权反馈
【摘要】:在一个典型的HDFS HA 场景中,一个NameNode处于Active 状态,另一个NameNode 处于Standby 状态。ActiveNameNode 对外提供服务。如果出现故障,这时可通过此种方式将NameNode 切换到另外一台机器。

Hadoop2.0新特性:高可用性(HA)

HA 即为高可用性High Availability,高可用性最关键的策略是消除单点故障。其主要用于解决NameNode 单点故障问题,该特性通过热备的方式为主NameNode 提供一个备用者,一旦主NameNode 出现故障,可以迅速切换至备NameNode,从而实现不间断对外提供服务。

NameNode 主要在两个方面影响HDFS 集群:一方面,NameNode 机器发生意外(如宕机),集群将无法使用,直到管理员重启;另一方面,NameNode 机器需要升级(包括软件、硬件升级),此时集群也将无法使用。

HDFS HA 功能通过配置Active(活跃)和Standby(待命)这两种状态,实现NameNodes 在集群中对NameNode 的热备来解决上述问题。在一个典型的HDFS HA 场景中,一个NameNode处于Active 状态,另一个NameNode 处于Standby 状态。ActiveNameNode 对外提供服务。例如:处理来自客户端的RPC 请求,而StandbyNameNode 则不对外提供服务,仅同步Active NameNode 的状态,以便能够在它失败时快速进行切换。如果出现故障(如机器崩溃或机器需要升级维护),这时可通过此种方式将NameNode 切换到另外一台机器。如图6.1 所示。(www.xing528.com)

图6.1 HDFS HA 架构图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈