工控网首页
>

应用设计

>

面向钢铁生产过程质量控制的动态数据挖掘方法

面向钢铁生产过程质量控制的动态数据挖掘方法

2006/11/6 11:27:00
1.浙江大学工业控制技术国家重点实验室,浙江杭州310027;2.上海宝信软件股份有限公司 [摘 要]质量控制对提高企业产品质量具有重要的意义。本文从钢铁生产过程的特点出发,将动态数据挖掘运用于质量控制中,阐述了利用数据挖掘解决质量预测问题和质量分析问题的一般方法。以宝钢连铸生产过程为背景进行挖掘实验,表明这种方法在实际应中的正确性和有效性。 [关键词]质量控制;动态数据挖掘;钢铁生产过程 0 引言 生产过程质量控制是利用生产过程的动态信息进行质量预测和质量控制。由于其实时性和较高的准确性,可以预估质量问题,从而降低钢铁企业的生产成本和经济损失。生产过程质量控制的基础是对生产过程的质量预测。因为只有对未来产品质量参数进行估计,才能在产品质量发生问题前调整生产过程,真正达到提高产品质量的目的。进行质量预测的手段是建立生产过程的质量模型,即以各种决定产品质量的变量为输入,以产品各质量指标为输出的数学模型。但由于影响因素较多而导致机理建模困难等原因,质量模型的建立比一般用于自动控制的对象建模更为困难。 数据挖掘是一类从大量数据中自动寻找规律的方法,在过去20年中得到了大量的研究。数据挖掘方法的特点是能从大量的数据中自动分析并提取未知的、潜在有用的知识,因此可用于复杂系统的行为建模和行为预测。传统的数据挖掘应用通常只处理静态的数据,即不包含时间信息的数据。但当将数据挖掘方法用于建立钢铁企业生产过程的质量模型时,由于传感器对生产过程不断采样的原因,获得的生产历史数据通常都是时间序列,即历史数据是和时间相关的—系列值。因此通常用于处理静态数据的数据挖掘方法不能直接应用于钢铁企业生产过程历史数据的挖掘。 动态数据挖掘是从海量时间序列数据中寻找规律的数据挖掘方法。将动态数据挖掘方法应用于钢铁企业生产过程质量控制时,主要目标有两个:(1)通过对钢铁生产过程历史记录的数据挖掘,建立产品质量预测模型,并运用于生产过程,进行实时质量预测;(2)在产品质量出现问题后,利用对历史数据的挖掘分析生产工艺对产品质量的影响,找出隐藏的生产规律,为钢铁企业改进工艺提供决策支持。 1 问题描述
本文所研究的面向质量控制的动态数据挖掘可表达为以下两类问题的求解过程。
2 面向质量控制的动态数据挖掘方法 2.1 样本抽取 与静态数据的挖掘不同,对多个时间序列进行动态数据挖掘时,需要解决的第1个问题是数据的样本抽取,即将各个传感器采样得到的多个时间序列数据根据其时间、空间上的相关性以及对产品质量检验结果的影响,抽取相应的子序列,组成数据挖掘的样本集合。这是因为对某一质量指标有影响的可能是不同工艺参数在不同时间段上的变化情况。 钢铁企业生产过程可以分为间歇型过程(如高炉炼铁过程)和连续型过程(如连续退火过程)。间歇型生产过程的特点是:单批产品在同一工艺装置中,一般要经历多个加工处理时段,因此通常其各个操作参数的设计值在生产过程的不同时段取不同的值。连续型生产过程的特点是:原料连续经过生产线各工艺装置处理后成为产品,为了保持生产的连续性,各工艺装置操作参数的设计值为定值。由于上述两类生产过程的不同特点,在进行数据样本抽取时必须采用不同的处理方法。下面分别加以阐述。 2.1.1 间歇型过程 对于间歇型生产过程,由于单批产品的质量检验是在该批产品生产完成后进行的,所以可以取单批产品在整个生产过程中完整的工艺参数测量值时间序列和质量指标测量值时间序列作为动态数据挖掘所需的样本。
2.1.2 连续型过程 对于连续型生产过程,因为不同的工艺参数在不同的时段对加工的产品质量发生影响,因此应将工艺参数的测量值时间序列中,对某个质量检验结果有影响的一段子序列提取出来,和质量指标测量值一起组成样本。
2.2模式提取和评价 2.2.1 质量不良原因的模式假设 通常产品质量不良的原因可分为两类,即工艺参数的设计值有错误;或在生产过程中工艺参数未能控制在设计值。本文提出的动态数据挖掘方法在用于钢铁企业生产过程质量控制时,基于以下关键性假设,即设产品质量不良的原因可以通过生产过程中工艺参数的时间序列实测样本反映出来。工艺参数的时间序列中某些特征的改变,引起生产质量的变化,而这些时间序列的特征,可以用模式来描述。 例如,在连铸生产工艺中,铸坯拉速不稳定时,容易出现纵向裂纹。根据此先验知识,可以将铸坯拉速测量值时间序列的方差作为影响铸坯纵向裂纹质量事故的一个模式。为了解铸坯拉速测量值时间序列的方差与铸坯纵向裂纹质量事故之间的定量关系,可以采用数据挖掘方法从海量的铸坯拉速测量值生产历史数据中去寻找。 根据上述质量不良原因的模式假设,在进行质量预测模型的建模或质量事故原因的分析时,要进行时间序列的模式提取和评价。 2.2.2 时间序列的模式提取和评价方法 时间序列的模式提取是从时间序列中抽取有价值的特征模式评价指标的过程。在经典的时间序列分析理论中,已给出了一类模式提取的方法:根据时间序列建立ARMA模型[3]。该方法把时间序列空间映射到ARMA模型中的参数空间,也称为时间序列的ARMA特征空间。但是ARMA特征没有物理意义,难以根据它来改进产品质量。 为了使模式评价指标具有物理意义,有三类可供选择的方法: (1)根据理论分析和实际经验,构造与产品质量有关的模式类。例如根据经验,冷连轧过程中带钢温度骤升骤降可能引起断带,因此将它作为带钢温度时间序列的一种模式。 (2)对于没有任何先验知识的情况,可以穷举构造所有可能的有物理意义的模式。例如时间序列的均值、方差、最大值、最小值、中间值、局部极值出现频率、单调性、凹凸性、与标准值的偏差、时间累计量等都可以被认为是候选的模式。 (3)对于只有部分先验知识的情况,可以结合前两种方法。 特征模式评价指标确定后,时间序列模式评价的一般步骤如下:
从上述过程可以看出,经过特征模式提取和评价,已经将时间序列数据转换成了不显含时间因素的模式评价值序列。 2.3数据挖掘过程 综上所述,对于生产过程质量控制而言,整个动态数据挖掘过程,包括根据生产过程的性质对时间序列数据进行样本抽取、根据给定的特征模式评价指标对时间序列进行特征模式评价、根据质量控制的要求建立质量预测或质量关联模型等三个组成部分。具体步骤总结如下: (1)确定m个可测的产品质量指标; (2)根据理论分析和实际经验,确定可能影响质量指标的因素。根据这些因素,确定参加挖掘n个可测的工艺参数以及相应的特征模式评价指标集合; (3)获取工艺参数的测量值时间序列,并使用第2.1.2节中介绍的方法对时间序列进行样本抽取,得到数据挖掘样本; (4)使用第2.2.2节中的方法,对样本进行模式评价,从而将数据样本转化为模式评价样本; (5)对于质量预测问题来说,使用回归分析方法建立如式(3)所示的质量预测模型,对于质量分析问题来说,使用关联分析方法建立如式(4)所示的质量分析模型; (6)使用测试样本集对挖掘结果进行测试; (7)输出数据挖掘结果。 3 应用实例 运用上述理论与方法,作者在一个冶金企业生产质量分析数据挖掘平台DMPlatform上,以某钢厂1900直弧型板坯连铸机生产过程铸坯纵裂质量控制为背景进行了动态数据挖掘试验。 定义质量指标为铸坯纵向裂纹,考虑的数据类型为逻辑值,即只考虑铸坯样本有无纵向裂纹。在生产中通过切片硫印的方式获取该质量指标的检验值,采样周期为1h。参与数据挖掘的工艺参数共有24个,最短的采样周期为5s(如结晶器循环冷却水和二冷段冷却水的温度),最长的采样周期为1min(如铸坯表面温度)。根据已知的连铸理论和经验知识,如:锰硫比增大或者硫含量降低时裂纹减少,拉速越不稳定越容易出现纵向裂纹等,确定了对各个工艺参数时间序列需要提取的具有物理意义的模式,如表1所示。
连铸是连续型生产过程,采用第2.1.2节中的方法从生产历史数据中抽取样本,共采集了60批铸坯的生产历史记录,每批数据记录的时间跨度为铸坯切片质量硫印检验前1h。因此24个工艺参数时间序列的最大长度为43 200个采样数据,总数据量约为200万个数据。然后对原始数据进行去除野值、数据平滑等预处理,接着根据表1对每批数据提取特征模式,最后得到60个样本。我们将前40个样本作为训练集,利用朴素Bayes分类建立质量预测模型。将后20个样本作为测试集,对获得的连铸铸坯质量预测模型进行了检验。表2为预测结果。
其中0表示质量合格,1表示有质量问题(表面裂纹)。可见只有No8和No20两个预测值和实际值不符合,预测成功率为90%。由于连铸板坯纵裂的形<
投诉建议

提交

查看更多评论
其他资讯

查看更多

智光节能内蒙古阿拉善左旗瀛海建材余热发电机组首次启动成功

智光电气台州电厂给水泵系统节能改造项目成功投运

智光节能荣登2014年度全国节能服务公司百强榜第五位

索引程序编程凸轮表

奥越信300系列PLC手册