Xlera8

使用 Amazon Lookout for Equipment 为业务线用户启用预测性维护

预测性维护是一种数据驱动的维护策略,用于监控工业资产,以检测可能导致设备故障的设备运行和健康异常。 通过主动监控资产状况,可以在问题发生之前提醒维护人员,从而避免代价高昂的计划外停机,从而提高整体设备效率 (OEE)。

然而,为预测性维护构建必要的机器学习 (ML) 模型既复杂又耗时。 它需要几个步骤,包括数据预处理、构建、训练、评估,然后微调多个 ML 模型,这些模型可以可靠地预测资产数据中的异常。 然后需要部署完成的 ML 模型并提供实时数据以进行在线预测(推理)。 将此过程扩展到各种类型和操作配置文件的多个资产通常会占用大量资源,以至于无法更广泛地采用预测性维护。

亚马逊对设备的监视,您可以无缝分析工业设备的传感器数据以检测异常机器行为——无需 ML 经验。

当客户使用 Lookout for Equipment 实施预测性维护用例时,他们通常会在三个选项之间进行选择以交付项目:自行构建、与 AWS 合作伙伴合作或使用 AWS 专业服务。 在投入此类项目之前,工厂经理、可靠性或维护经理以及生产线领导等决策者希望看到预测性维护可以在其业务线中发现潜在价值的证据。 这种评估通常作为概念验证 (POC) 的一部分执行,并且是业务案例的基础。

这篇文章面向技术和非技术用户:它提供了一种使用您自己的数据评估 Lookout for Equipment 的有效方法,使您能够衡量它为您的预测性维护活动提供的商业价值。

解决方案概述

在本文中,我们将指导您完成在 Lookout for Equipment 中摄取数据集、检查传感器数据质量、训练模型和评估模型的步骤。 完成这些步骤将有助于深入了解设备的健康状况。

先决条件

您只需拥有一个 AWS 账户和资产的传感器数据历史记录即可开始,这些资产可以从预测性维护方法中获益。 传感器数据应作为 CSV 文件存储在 亚马逊简单存储服务 (Amazon S3) 从您的帐户存储桶。 您的 IT 团队应该能够通过参考满足这些先决条件 格式化数据. 为简单起见,最好将所有传感器数据存储在一个 CSV 文件中,其中行是时间戳,列是单个传感器(最多 300 个)。

一旦您的数据集在 Amazon S3 上可用,您就可以按照本文的其余部分进行操作。

添加数据集

Lookout for Equipment 使用项目来组织用于评估工业设备的资源。 要创建新项目,请完成以下步骤:

  1. 在 Lookout for Equipment 控制台上,选择 创建项目.

单击服务主页上的创建项目按钮

  1. 输入项目名称并选择 创建项目.

创建项目后,您可以摄取一个数据集,该数据集将用于训练和评估异常检测模型。

  1. 在项目页面上,选择 添加数据集.

单击项目仪表板上的添加数据集

  1. 针对 S3位置, 输入数据的 S3 位置(不包括文件名)。
  2. 针对 模式检测方法, 选择 按文件名,它假定资产的所有传感器数据都包含在指定 S3 位置的单个 CSV 文件中。
  3. 其他设置保持默认,选择 开始摄取 开始摄取过程。

配置您的数据源详细信息并单击开始摄取

摄入可能需要大约 10-20 分钟才能完成。 在后台,Lookout for Equipment 执行以下任务:

  • 它检测数据的结构,例如传感器名称和数据类型。
  • 传感器之间的时间戳对齐并填充缺失值(使用最新的已知值)。
  • 删除重复的时间戳(只保留每个时间戳的最后一个值)。
  • Lookout for Equipment 使用多种类型的算法来构建 ML 异常检测模型。 在摄取阶段,它会准备数据,以便将其用于训练那些不同的算法。
  • 它分析测量值并将每个传感器分级为高、中或低质量。
  1. 数据集摄取完成后,通过选择检查它 查看数据集 在项目页面的第 2 步下。

单击项目仪表板上的查看数据集

在创建异常检测模型时,选择最好的传感器(包含最高数据质量的传感器)通常对于提供可操作见解的培训模型至关重要。 这 数据集详细信息 部分显示了传感器等级的分布(高、中、低之间),而表格分别显示了每个传感器的信息(包括传感器名称、日期范围和传感器数据的等级)。 通过这份详细报告,您可以就将使用哪些传感器来训练模型做出明智的决定。 如果数据集中的大部分传感器被评为中等或低等,则可能存在需要调查的数据问题。 如有必要,您可以通过选择将数据文件重新上传到 Amazon S3 并再次提取数据 替换数据集.

传感器等级仪表板概述

通过在详细信息表中选择传感器等级条目,您可以查看有关导致给定等级的验证错误的详细信息。 显示和处理这些细节将有助于确保提供给模型的信息是高质量的。 例如,您可能会看到一个信号有意想不到的大块缺失值。 这是数据传输问题,还是传感器出现故障? 是时候深入研究您的数据了!

单个传感器等级概述

要详细了解 Lookout for Equipment 在对传感器进行分级时解决的不同类型的传感器问题,请参阅 评估传感器等级. 开发人员还可以使用 列表传感器统计 API.

当您对数据集感到满意时,您可以进入下一步训练模型以预测异常。

训练模型

Lookout for Equipment 允许训练特定传感器的模型。 这使您可以灵活地试验不同的传感器组合或排除分级较低的传感器。 完成以下步骤:

  1. 传感器详情 数据集页面上的部分,选择要包含在模型中的传感器并选择 建立模型.

选择用于训练模型的传感器

  1. 针对 型号名称,输入型号名称,然后选择 下一页.

给个型号名

  1. 培训和评估设置 部分,配置模型输入数据。

为了有效地训练模型,需要将数据分成单独的训练集和评估集。 您可以在此部分定义此拆分的日期范围,以及传感器的采样率。 你如何选择这种分裂? 考虑以下:

  • Lookout for Equipment 预计训练范围内至少有 3 个月的数据,但最佳数据量取决于您的用例。 可能需要更多数据来说明您的生产经历的任何类型的季节性或运营周期。
  • 评估范围没有限制。 但是,我们建议设置一个包含已知异常的评估范围。 这样,您就可以测试 Lookout for Equipment 是否能够捕获导致这些异常的任何相关事件。

通过指定采样率,Lookout for Equipment 可以有效地对传感器数据进行下采样,从而显着减少训练时间。 理想的采样率取决于您怀疑数据中的异常类型:对于趋势缓慢的异常,选择 1-10 分钟之间的采样率通常是一个很好的起点。 选择较低的值(增加采样率)会导致更长的训练时间,而较高的值(低采样率)会缩短训练时间,但存在从数据中删除与预测异常相关的领先指标的风险。

配置模型训练的输入数据

要仅对工业设备运行时数据的相关部分进行培训,您可以通过选择传感器并定义指示设备处于开启或关闭状态的阈值来执行关闭时间检测。 这一点很重要,因为它允许 Lookout for Equipment 过滤掉机器关闭时的训练时间段。 这意味着该模型仅学习相关的操作状态,而不仅仅是机器关闭时的状态。

  1. 指定您的关闭时间检测,然后选择 下一页.

指定关闭时间检测

您可以选择提供数据标签,这些标签指示维护周期或已知的设备故障时间。 如果您有可用的此类数据,您可以创建一个 CSV 文件,其中的数据位于 记录格式,将其上传到 Amazon S3,并用于模型训练。 提供标签可以告诉 Lookout for Equipment 它应该在哪里发现已知异常,从而提高训练模型的准确性。

  1. 指定任何数据标签,然后选择 下一页.

(可选)指定数据标签

  1. 在最后一步中检查您的设置。 如果一切正常,您就可以开始训练了。

根据数据集的大小、传感器的数量和采样率,训练模型可能需要几分钟或最多几个小时。 例如,如果您使用 1 年的数据以 5 分钟的采样率使用 100 个传感器且没有标签,则训练模型将花费不到 15 分钟的时间。 另一方面,如果您的数据包含大量标签,训练时间可能会显着增加。 在这种情况下,您可以通过合并相邻的标签周期来减少它们的数量来减少训练时间。

您刚刚在没有任何 ML 知识的情况下训练了您的第一个异常检测模型! 现在让我们看看您可以从经过训练的模型中获得的见解。

评估经过训练的模型

模型训练完成后,您可以通过选择查看模型的详细信息 查看模型 在项目页面上,然后选择模型的名称。

除了名称、状态和训练时间等一般信息外,模型页面还总结了模型性能数据,例如检测到的标记事件数(假设您提供了标签)、平均预警时间以及在外部检测到的异常设备事件数标签范围。 以下屏幕截图显示了一个示例。 为了获得更好的可见性,检测到的事件(功能区顶部的红色条)与标记的事件(功能区底部的蓝色条)一起可视化。

评估模型

您可以通过选择时间线视图中代表异常的红色区域来选择检测到的事件,以获取更多信息。 这包括:

  • 事件开始和结束时间及其持续时间。
  • 带有模型认为与异常发生原因最相关的传感器的条形图。 百分比分数表示计算的总体贡献。

选定事件的信号贡献条形图

这些见解使您能够与您的过程或可靠性工程师合作,对事件进行进一步的根本原因评估,并最终优化维护活动,减少计划外停机时间,并确定次优操作条件。

为了通过实时洞察(推理)支持预测性维护,Lookout for Equipment 支持通过推理计划对在线数据进行实时评估。 这需要定期将传感器数据上传到 Amazon S3,然后 Lookout for Equipment 使用训练好的模型对数据进行推理,提供实时的异常评分。 可以在 Lookout for Equipment 控制台上查看推理结果,包括检测到的异常事件的历史记录。

7 天推理结果仪表板

结果也写入 Amazon S3 中的文件,允许与其他系统集成,例如计算机化维护管理系统 (CMMS),或实时通知操作和维护人员。

当您增加 Lookout for Equipment 的采用率时,您将需要管理更多的模型和推理计划。 为了使这个过程更容易, 推理时间表 页面在单个视图中列出当前为项目配置的所有调度程序。

推理调度器列表

清理

当您完成对 Lookout for Equipment 的评估后,我们建议清理所有资源。 您可以删除 Lookout for Equipment 项目以及数据集和通过选择项目创建的任何模型,选择 删除, 并确认操作。

总结

在本文中,我们介绍了在 Lookout for Equipment 中摄取数据集、在其上训练模型并评估其性能以了解它可以为单个资产揭示的价值的步骤。 具体来说,我们探索了 Lookout for Equipment 如何为预测性维护流程提供信息,从而减少计划外停机时间并提高 OEE。

如果您遵循自己的数据并对使用 Lookout for Equipment 的前景感到兴奋,下一步就是在您的 IT 组织、主要合作伙伴或我们的 AWS 专业服务团队的支持下启动试点项目。 该试点应针对数量有限的工业设备,然后扩大规模,最终将所有资产纳入预测性维护范围。


关于作者

 约翰·富克斯尔 是 Amazon Web Services 的解决方案架构师。 他指导制造业的企业客户实施 AI/ML 用例、设计现代数据架构以及构建可提供切实业务价值的云原生解决方案。 Johann 拥有数学和定量建模方面的背景,并结合了 10 年的 IT 经验。 工作之余,他喜欢与家人共度时光并亲近大自然。

米歇尔·霍劳(MichaëlHoarau) 是 AWS 的一名工业 AI/ML 专家解决方案架构师,根据时机在数据科学家和机器学习架构师之间交替。 他热衷于将 AI/ML 的力量带到他的工业客户的车间,并致力于广泛的 ML 用例,从异常检测到预测产品质量或制造优化。 在不帮助客户开发下一个最佳机器学习体验时,他喜欢观察星星、旅行或弹钢琴。

在线答疑

你好呀! 我怎么帮你?