硬件 – Hadoop磁盘发生故障,你做什么?

我想了解一下当其中一个Hadoop服务器磁盘发生故障时该怎么做的策略.

假设我有多个(> 15个)Hadoop服务器和1个名称节点,从属的6个磁盘中有一个停止工作,磁盘通过SAS连接.我不关心从这个磁盘检索数据,但是关于保持集群运行的一般策略.

你是做什么?

最佳答案
我们部署了hadoop.您可以指定文件的复制编号.复制文件的次数. Hadoop在namenode上有一个单点故障.如果您担心磁盘外出,请将复制增加到3个或更多.

然后,如果磁盘坏了,那很简单.把它扔掉并重新格式化. Hadoop会自动调整.实际上,一旦磁盘熄灭,它将开始重新平衡文件以维护复制数.

我不确定你为什么会有这么大的赏金.你说你不关心检索数据. Hadoop在名称节点上只有一个故障点.所有其他节点都是可消耗的.

转载注明原文:硬件 – Hadoop磁盘发生故障,你做什么? - 代码日志