摘要:采用混料回归设计原理设计试验保护渣组成。以试验为基础,针对常用BP算法的不足采用动量因子与自适应学习速率相结合的BP改进算法建立神经网络保护渣性能预测模型。研究结果表明该模型预测精度高,适用组元多、成分变化范围大;对保护渣的性能预测取得了较好的效果,能为保护渣设计提供理论指导。
关键词:保护渣;预测模型;BP神经网络
连铸保护渣是连铸生产中的重要功能材料,对提高铸坯质量尤其是表面质量,稳定工艺操作有着十分重要的作用。由于不同钢种、不同浇铸断面、以及不同的生产工艺条件对连铸保护渣性能的要求呈现多样性。开发针对具体钢种、断面和生产条件的保护渣,就必须对熔融保护渣的组成进行科学合理的设计和优化。对保护渣的组成设计,目前基本上是基于经验积累的配方修正,这需要较多的实验次数和开发者长期的相关工作的经验。
关于保护渣组分与性能之间关系的研究,目前基本上都是以一定条件下的实验数据为基础,采用数理统计方法、建立回归方程等统计回归模型。由于保护渣理化性能与其组成之间存在着复杂的非线性关系,回归数学模型因数据样本来源有限、实验数据点变化范围的局限性等因素,使得实际用于保护渣性能预测的准确性受到限制,亦因模型无拓展性、结构复杂、计算烦琐等,实用化仍然比较困难。
随着计算机的发展和广泛应用,神经网络技术得到了迅速发展。将神经网络技术引入保护渣性能预测会有广阔的应用前景。本文在试验的基础上,建立了神经网络保护渣性能预测模型。
1.BP网络的改进算法
BP学习算法是目前人工神经网络技术中应用最广也最为成功的学习算法。BP网络由输入层、输出层以及一个或多个隐含层所构成的神经网络,网络是按有教师示教的方式进行学习,它的学习过程就是不断修正网络权值和阈值使得实际输出与期望输出之间误差逐渐减小以至达到期望误差的过程。BP算法是一个非线性优化问题,普遍采用梯度下降法,其权值ωji修正公式为:
ωji(n+1)= ωji(n)+Δωji (1)
式(1)中,Δωji(n)为第九步从i到j神经元的权值,修正值
əε(n)
Δwji(n)=-μ----------,ε为输出平方误差函数,η为学习速率。
əωji(n)
在学习过程中,标准BP算法随着误差值越来越小导致梯度下降调整的幅度也越来越小,从而使网络学习训练时间长,收敛速度慢;此外网络有可能陷于局部极小值。为了改进学习速度以及避免局部极小值,在式(1)的基础上添加动量因子:
əε(n)
Δωji(n)=αΔωji(n-1)-η------------ (2)
əωji(n)
动量因子α的融人加速权值向减小的方向下降,同时对网络有稳定作用。此外,在网络训练过程中,单一的、固定不变的学习速率很难同时兼顾不同误差变化范围内的收敛情况,特别是在极小点附近,单一的学习速率会使收敛速度减慢。因此本文采用了自适应学习速率以克服单一学习速率缺陷,其调整公式为:
∣1.05η(k) SSE(k+1)<SSE(k)
η(k+1)=∣0.7η(k) SSE(k+1)>1.04SSE(k) (3)
∣η(k) 其它
式(3)中,SSE(k)为第k次的误差平方和。
调整学习速率的准则是检查本次学习误差是否小于上次学习误差,如果是则说明本次迭代有效,说明当前的学习速率比较适合误差变化趋势,可以适当的加大学习速率。如果本次学习误差大于上次学习误差说明产生过调,此时就应该减小学习速率。
建立预测模型时使用动量因子与自适应学习速率相结合的方法改进BP算法,旨在克服局部极小问题、加快学习速率。
2神经网络学习样本的建立
在分析和调研现行成功应用于生产的保护渣基本组成特征的基础上,确定CaO、SiO2、Na2O、B2O3、A12O3、CaF2、Li2O、MnO、MgO等9种物质作为本实验研究保护渣的组元,各组元设置了较宽的成分变化范围,基本涵盖了当前各类典型保护渣的成分范围,能满足多种保护渣开发的需要,成分变化范围如表1所示。试验采用兼有上、下约束条件的极端顶点混料回归设计方法进行设计,此种方法应用范围与保护渣成分范围的变化有相同意义,并且极端顶点的试验区域在二维或三维上的投影与相图有相似之处,同时使数据具有广泛性和代表性便于分析。经混料回归设计得到233组保护渣组分,采用符合国家新颁行业标准的测试方法和装置,即半球点测试仪和旋转粘度计分别测量各试验渣的熔化温度及1 300℃时的粘度,与成分一同作为神经网络的学习样本。

3人工神经网络模型的建立
人工神经网络强大的自适应、自学习及容错、推广能力,能够逼近任意复杂的非线性系统,能够从不清楚的背景和不完全的数据中自动提取反映事物内在规律和特点的知识、并能够通过学习所获得的知识对问题进行求解。因此神经网络在很多领域得到了广泛而成功的应用。但目前在国内,神经网络在连铸保护渣性能预测尤其是在多组元、大范围连铸保护渣性能预测方面的应用还较少。
3.1 网络层数的确定
1 989年Robert Hecht—Nielson证明了对于在任何闭区间内一个连续函数都可以用一个隐含层的BP网络来逼近,因而一个3层的BP网络可以完成任意的n维到m维的映射。因此本模型采用3层结构的网络。
3.2 输入、输出层单元数的确定
神经网络的输入、输出层单元数既没有理论指导也没有经验可寻,完全是按照使用者自己的需求来确定的。本模型主要针对保护渣的基本性能即粘度和熔化温度进行预测,为了提高预测的准确性,分别对粘度和熔化温度进行训练和预测,因此设定输出层单元数为1。对于输入层主要是针对保护渣的常见组分,同时也根据实验所提供的数据最后确定选取CaO、SiO2、Na2O、Li2 O、A12O3、B2 O3、CaF2、MgO、MnO等9个因素作为输入层单元数。
3.3 隐含层单元数的确定
1947年,Kolmogorov阐述了一个涉及到隐含层单元个数的内容,人们称之为Kolmogorov定理。此定理提及输入层n个单元,隐含层2n+1个单元,输出优个单元组成的神经网络可以精确实现任何一个连续函数。根据Kolmogorov定理,确定选取初始隐含层单元数为20。随着隐含层单元数的增加,神经网络学习的速率缩短,其影响规律如表2所示。

由表2可得,隐含层神经元太少,网络不能很好地学习,需要训练的次数多,训练精度不高,所以在此种意义上可以增大隐含层单元数来减小迭代次数、缩短学习时间;但不能无谓的增大隐含层单元数,因为过大的隐含层单元数将增加计算的复杂度,也就增加了训练时间,同时它还会产生其它问题,经对比选择隐含层单元数为50。
3.4初始权值的确定
初始权值对于学习是否达到局部最小,是否能够收敛以及训练时间的长短关系很大。模型中采用随机数作为初始权值。
4仿真结果
利用结构为9—50—1的网络对随机抽取的223组数据进行学习训练,利用学习训练后的BP网络对未训练的10组(化学成分如表3所示)数据进行预测。其预测结果如图1、2所示。

对比实际值与网络模型预测值,其结果表明,除个别较高和极低粘度值的渣号外,预测误差均小于0.02 Pa·s,能满足目前保护渣研究和开发的需要。适当增加个别突变点附近的实验点和进一步改进低粘度测试方法,有助于提高神经网络学习的精度,减小预测误差;熔化温度实际值与预测值之间的绝对误差最大为12℃;其相对误差平均值为0.362%且均小于1.5%。说明预测值与实际值吻合较好,神经网络保护渣性能预测模型误差变化波动小。

5结 论
研究表明,利用基于自适应学习速率和动量因子相结合的BP改进算法神经网络预测模型预测保护渣性能是完全可行的,也是实用的。将神经网络应用到保护渣性能的预测具有极大理论意义和实际意义,能够为冶金工作者设计保护渣提供理论和技术上的指导,减少保护渣组成设计中的试验工作、缩短开发周期、减少开发成本。