磁盘空间利用率 – 计算磁盘已满的天数

我们使用石墨来跟踪磁盘利用率的历史记录.我们的警报系统会查看石墨数据,以便在可用空间低于一定数量的区块时提醒我们.

我想获得更聪明的警报 – 我真正关心的是“在我必须对自由空间做些什么之前我还有多长时间?”,例如如果趋势显示在7天内我将耗尽磁盘空间然后提出警告,如果它少于2天然后引发错误.

衍生品和Holt Winters Confidence乐队可以非常智能地使用Graphite的标准仪表板界面,但到目前为止,我还没有找到将其转换为可操作指标的方法.我也可以通过其他方式处理数字(只需从石墨中提取原始数据并运行脚本来完成此操作).

一个复杂的问题是图形不平滑 – 文件被添加和删除但随着时间推移的一般趋势是磁盘空间使用量增加,因此可能需要查看本地最小值(如果查看“无磁盘”度量标准)并绘制低谷之间的趋势.

有没有人这样做过?

最佳答案
老实说,“Days Until Full”实际上是一个糟糕的指标 – 文件系统在接近100%利用率时变得非常愚蠢.
我真的建议使用传统的85%,90%,95%阈值(警告,警报和关键你 – 真的需要解决这个 – 现在分别) – 这应该会给你很多现代磁盘上的警告时间(比方说1TB驱动器:85%的太字节仍会留下很多空间,但你知道一个潜在的问题,90%你应该计划磁盘扩展或其他一些缓解,并且95%的TB级你还剩下50GB并且应该很好地修复动作.

这也确保您的文件系统或多或少地以最佳方式运行:它有足够的空间来处理创建/修改/移动大文件.

如果您的磁盘不是现代磁盘(或者您的使用模式涉及将更多数据投入磁盘),您可以轻松调整阈值.

如果您仍然使用“完整日期”指标,则可以从石墨中提取数据并对其进行一些数学计算. IBM’s monitoring tools implement several days-until-full metrics可以让你知道如何实现它,但基本上你正在考虑历史上两点之间的变化率.

为了您的理智,您可以使用Graphite的衍生物(它将为您提供随时间变化的速率)和使用它的项目,但如果您真的想要“更聪明”的警报我建议使用每日和每周的变化率(计算基于当天/周的峰值使用情况).

您使用的具体预测(最小变化率,最大变化率,平均变化率,加权平均值等)取决于您的环境. IBM的工具提供了许多不同的视图,因为很难确定一个通用的模式.

最终,没有算法能够很好地完成你想要的那种计算.磁盘利用率是由用户驱动的,而用户是Rational Actor模型的对立面:所有的预测都可以在一个疯狂的人面前决定今天是他们要对他们执行完整的系统内存转储的那一天.主目录.只因为.

转载注明原文:磁盘空间利用率 – 计算磁盘已满的天数 - 代码日志