查看: 190|回复: 3

hdfs高可用--NA HA

[复制链接]
论坛徽章:
12
Oracle研习者初级
日期:2014-09-19 14:07:42Oracle研习者高级
日期:2019-07-25 14:10:03python徽章
日期:2018-12-20 15:14:57redis徽章
日期:2018-06-21 17:16:11mysql徽章
日期:2017-12-22 16:01:10python徽章
日期:2017-08-17 17:09:36mysql徽章
日期:2017-05-25 16:50:35Mycat徽章
日期:2017-02-23 15:56:04大型分布式徽章
日期:2017-02-16 16:49:55mysql徽章
日期:2016-07-14 11:09:49Oracle研习者中级
日期:2016-06-02 10:27:16Hadoop研习者初级
日期:2019-08-01 16:32:19
发表于 2019-6-14 17:43 | 显示全部楼层 |阅读模式

tm HTML 高可用

回复

使用道具 举报

论坛徽章:
12
Oracle研习者初级
日期:2014-09-19 14:07:42Oracle研习者高级
日期:2019-07-25 14:10:03python徽章
日期:2018-12-20 15:14:57redis徽章
日期:2018-06-21 17:16:11mysql徽章
日期:2017-12-22 16:01:10python徽章
日期:2017-08-17 17:09:36mysql徽章
日期:2017-05-25 16:50:35Mycat徽章
日期:2017-02-23 15:56:04大型分布式徽章
日期:2017-02-16 16:49:55mysql徽章
日期:2016-07-14 11:09:49Oracle研习者中级
日期:2016-06-02 10:27:16Hadoop研习者初级
日期:2019-08-01 16:32:19
 楼主| 发表于 2019-6-14 17:43 | 显示全部楼层
##安装后查看和验证
[hadoop@hadoop1 hadoop]$ hdfs haadmin -getServiceState nn1   
19/06/14 17:09:53 DEBUG util.Shell: setsid exited with exit code 0
19/06/14 17:09:53 DEBUG tools.DFSHAAdmin: Using NN principal:
19/06/14 17:09:53 DEBUG namenode.NameNode: Setting fs.defaultFS to hdfs://hadoop1:8020
19/06/14 17:09:53 DEBUG ipc.ProtobufRpcEngine: Call: getServiceStatus took 105ms
active
[hadoop@hadoop1 hadoop]$ hdfs haadmin -getServiceState nn2
19/06/14 17:11:29 DEBUG ipc.ProtobufRpcEngine: Call: getServiceStatus took 107ms
standby

手工切换,将active的NameNode从nn1切换到nn2
[hadoop@hadoop1 hadoop]$ hdfs haadmin -DfSHAadmin -failover nn1 nn2
19/06/14 17:20:16 DEBUG ipc.ProtobufRpcEngine: Call: gracefulFailover took 1467ms
Failover to NameNode at hadoop2/192.168.19.73:8040 successful
[hadoop@hadoop1 hadoop]$ hdfs haadmin -getServiceState nn1
19/06/14 17:29:49 DEBUG ipc.ProtobufRpcEngine: Call: getServiceStatus took 81ms
active
[hadoop@hadoop1 hadoop]$ hdfs haadmin -getServiceState nn2
19/06/14 17:30:08 DEBUG ipc.Client: Failed to connect to server: hadoop2/192.168.19.73:8040: retries get failed due to exceeded maximum allowed retries number: 1
java.net.ConnectException: Connection refused
然后启动nn2 的namenode在查看变为standby
[hadoop@hadoop2 ~]$ /opt/hadoop/sbin/hadoop-daemon.sh  start  namenode
starting namenode, logging to /opt/hadoop/logs/hadoop-hadoop-namenode-hadoop2.out
19/06/14 17:31:03 DEBUG ipc.Client: IPC Client (413601558) connection to hadoop2/192.168.19.73:8040 from hadoop got value #0
19/06/14 17:31:03 DEBUG ipc.ProtobufRpcEngine: Call: getServiceStatus took 106ms
standby
回复 支持 反对

使用道具 举报

论坛徽章:
12
Oracle研习者初级
日期:2014-09-19 14:07:42Oracle研习者高级
日期:2019-07-25 14:10:03python徽章
日期:2018-12-20 15:14:57redis徽章
日期:2018-06-21 17:16:11mysql徽章
日期:2017-12-22 16:01:10python徽章
日期:2017-08-17 17:09:36mysql徽章
日期:2017-05-25 16:50:35Mycat徽章
日期:2017-02-23 15:56:04大型分布式徽章
日期:2017-02-16 16:49:55mysql徽章
日期:2016-07-14 11:09:49Oracle研习者中级
日期:2016-06-02 10:27:16Hadoop研习者初级
日期:2019-08-01 16:32:19
 楼主| 发表于 2019-6-14 17:45 | 显示全部楼层
NameNode健康检查:
[hadoop@hadoop1 hadoop]$ hdfs haadmin -checkHealth nn1
将其中一台NameNode给kill后, 查看健康状态:
[hadoop@hadoop2 ~]$ jps
3537 DFSZKFailoverController
3748 NameNode
3878 DataNode
3606 JournalNode
3336 QuorumPeerMain
4411 Jps
4012 ResourceManager
[hadoop@hadoop2 ~]$ kill 3748
[hadoop@hadoop1 hadoop]$ hdfs haadmin -checkHealth nn1
[hadoop@hadoop1 hadoop]$ hdfs haadmin -checkHealth nn2
查看所有的DataNode列表
[hadoop@hadoop1 hadoop]$  hdfs dfsadmin -report | more
查看正常DataNode列表
hdfs dfsadmin -report -live
查看异常DataNode列表:
hdfs dfsadmin -report -dead
获取指定DataNode信息(运行时间及版本等):
hdfs haadmin -checkHealth nn2
回复 支持 反对

使用道具 举报

论坛徽章:
12
Oracle研习者初级
日期:2014-09-19 14:07:42Oracle研习者高级
日期:2019-07-25 14:10:03python徽章
日期:2018-12-20 15:14:57redis徽章
日期:2018-06-21 17:16:11mysql徽章
日期:2017-12-22 16:01:10python徽章
日期:2017-08-17 17:09:36mysql徽章
日期:2017-05-25 16:50:35Mycat徽章
日期:2017-02-23 15:56:04大型分布式徽章
日期:2017-02-16 16:49:55mysql徽章
日期:2016-07-14 11:09:49Oracle研习者中级
日期:2016-06-02 10:27:16Hadoop研习者初级
日期:2019-08-01 16:32:19
 楼主| 发表于 2019-6-14 17:45 | 显示全部楼层
###YARN相关的命令
查看resourceManager状态的命令
[hadoop@hadoop1 hadoop]$ yarn rmadmin -getServiceState rm1
19/06/14 17:33:45 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
active
[hadoop@hadoop1 hadoop]$ yarn rmadmin -getServiceState rm2
19/06/14 17:33:52 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
standby
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2019-8-22 02:12 , Processed in 0.134355 second(s), 33 queries .

关闭

扫一扫加入
本版微信群