本
文
摘
要
当资源有限,或者收集真实数据过于昂贵或不切实际时,如何遵循现实的预测和时间表?模拟数据是否值得信任,可进行准确预测?这就是 Monte Carlo 模拟的用武之地。
然而,实际上,模拟数据通常用于许多场景,如资源有限的场景,或者收集真实数据过于昂贵或不切实际的场景。Monte Carlo 模拟是一种数学建模技术,可允许您查看所有可能的结果并评估风险以做出数据驱动型决策。通过大量随机计算模拟运行历史数据,以预测未来项目在类似情况下的可能结果。
Minitab Engage 是一个软件平台,它将用于执行质量项目的桌面应用程序与 Web 控制台相结合,从而使报告整个质量计划变得易如反掌。Monte Carlo 模拟工具是桌面应用程序中的一流工具之一,它使模拟方法变得非常易于访问。
Monte Carlo 方法使用重复随机抽样来生成要用于数学模型的模拟数据。此模型通常来自统计分析(如实验设计或回归分析)。
假设您研究一个过程并使用统计量对其建模,如下所示:
使用这种类型的线性模型,可以将过程输入值输入到方程中并预测过程输出。但是,在现实世界中,由于变异性,输入值不会是单个值。不幸的是,这种输入变异性会导致输出中出现变异性和缺陷。
在考虑不确定性的同时设计更好的过程
为了设计更好的过程,您可以收集大量数据来确定在各种条件下输入变异性与输出变异性之间的关系。但是,如果您了解输入值的典型分布,并且您有一个对过程进行建模的方程,则可以轻松生成海量模拟输入值并将它们输入到过程方程中,以生成过程输出的模拟分布。
您还可以轻松更改这些输入分布以回答“如果…怎么办”类型的问题。这就是 Monte Carlo 模拟的全部内容。在即将介绍的 Minitab Engage 用法示例中,我们将更改模拟数据的均值和标准差以改进产品质量。
使用 Minitab Engage 进行 Monte Carlo 模拟的分步示例
一家建筑产品制造商的材料工程师正在开发一种新的绝缘产品。
该工程师进行了一项试验并使用统计量来分析可能会影响产品绝缘效果的过程因子。对于这个 Monte Carlo 模拟示例,我们将使用上面显示的回归方程,该方程描述了过程中涉及的统计意义显著的因素。
步骤 1:定义过程输入和输出
我们需要做的第一件事是定义输入及其值的分布。
过程输入在回归输出中列出,工程师熟悉每个变量的典型均值和标准差。对于输出,工程师可以从 Minitab Statistical Software 复制用来描述过程的回归方程并将其粘贴到 Engage 的 Monte Carlo 工具中。
如下图所示,可以轻松键入过程相关输入和输出的信息。
验证模型,然后可以运行模拟(默认情况下,Engage 会以极快的速度运行 50,000 次模拟,但您可以指定更大或更小的次数值)。
Engage 使用能力分析的典型输出(能力直方图、缺陷百分比和 Ppk 统计量)为您解释结果。它正确地指出我们的 Ppk 低于普遍接受的最小值。
Engage 不但运行模拟并让您确定后续做法,而且还确定过程不令人满意并提出一系列智能步骤来改进过程能力。
它还知道控制均值通常比控制变异性更容易。因此,Engage 提出的下一步是进行用来查找均值设置的参数优化,均值设置可在考虑输入变异性的同时最大限度地减少缺陷数量。
步骤 2:定义参数优化的目标和搜索范围
在这个阶段,我们希望 Engage 找到均值输入设置的最佳组合,以最大限度地减少缺陷。可以使用参数优化来指定目标并利用您的过程知识来定义输入变量的合理搜索范围。
下面是模拟结果。
一眼就可以看出缺陷百分比下降了。我们还可以在表中看到最佳输入设置。然而,我们的 Ppk 统计量仍低于普遍接受的最小值。幸运的是,Engage 为我们推荐了可进一步改进过程能力的后续步骤。
步骤 3:控制变异性以执行敏感度分析
到目前为止,我们已经通过优化均值输入设置来改进过程。这大大减少了缺陷,但我们在 Monte Carlo 模拟中还有更多工作要做。现在,我们需要减少过程输入的变异性以进一步减少缺陷。
减少变异性通常更难。因此,您不希望浪费资源来控制不会减少缺陷数量的输入的标准差。幸运的是,Engage 包含一个创新型图表,可帮助您确定在哪些输入中通过控制变异性可最大程度地减少缺陷数量。
在上图中,寻找带倾斜直线的输入,因为减小这些标准差可以降低输出中的变异性。相反,您可以放宽带平直直线的输入的公差,因为它们不会影响输出中的变异性。
在上图中,斜率基本相等。因此,我们将尝试减小几个输入的标准差。您需要利用过程知识来确定实际的减少量。要更改设置,可以单击线上的点,或使用表中的下拉菜单。
最终的 Monte Carlo 模拟结果
成功!过程中的缺陷数量有所减少,Ppk 统计量为 1.34 且高于基准值。该假定表向我们展示了应当尝试使用的过程输入的新设置和标准差。如果我们再次运行参数优化,它将成为过程的中心,我相信我们的缺陷会更少。
另外,所有这些都是在未收集任何进一步数据的情况下完成的,因为我们知道输入值的典型分布,并且有一个对过程进行建模的方程。