摘 要:基于反射光谱技术原理研究润滑油的污染浓度预测模型。 选用纯净润滑油和原态污染油为原料, 采用等体积法逐一配置不同浓度的样本; 调整好光纤探头与样品之间的距离及方位角并保持不变, 采用脉冲氙灯为激发光源, 利用波段在200~850 nm范围的光谱仪对不同浓度的样本进行反射光谱测量实验。 实验曲线观察分析表明, 润滑油的污染浓度越高, 反射光谱的强度越低。 在采用变步长算法对原始实验数据进行稀疏采样的基础上, 分别采用相关系数法、 主成分分析法、 主成分分析结合相关系数法(主成分-相关系数法)选取工作润滑油在220~780 nm宽波段范围内的优势特征波长, 并在所选取的优势波长处建立了润滑油污染浓度与光谱反射率的指数关系模型。 测试结果表明, 主成分-相关系数法选取的优势波长378.93 nm, 所建立的污染浓度与光谱反射率的指数回归模型能够较好地实现润滑油污染浓度大于0.06时的预测和估计。 基于主成分-相关系数法选取优势特征波长所建立的指数关系回归模型, 因混合介质及浓度的特异性条件, 不服从低浓度均匀透明溶液中的朗伯-比尔定律, 适用于较高污染浓度的润滑油质量状态估计, 为进一步实现工作润滑油污染浓度的反射光谱法在线快速准确测定提供了可行性实验依据。
关键词:反射光谱; 润滑油; 指数模型; 主成分-相关系数
引 言
众所周知, 润滑油被广泛应用于各类发动机中, 在当今工业领域有着极为重要的地位。 它保护运动部件, 具有减少摩擦、 磨损和清洗发动机内部等功能[1]。 目前润滑油在设备使用过程中大多采用定期换油, 此方法存在很大的盲目性和局限性。 现代科技的兴起推动了油液监测技术的发展, 通过油液在线监测和数据分析及时反映油品的质量, 在其下降到无法保证设备正常运行时及时更换, 不仅可以延长设备使用寿命, 而且有利于节能环保[2]。
油液监测技术主要包含理化分析、 电学分析、 铁谱分析、 声学分析、 光谱分析等[3]。 但是理化分析方法、 铁谱分析方法、 声学检测方法等难以实现在线测量, 电学检测方法检测精度较低, 而光谱分析以其非接触性、 检测速度快、 精确度高等优点在润滑油检测方面得到了广泛的应用[4]。 近几年采用反射光谱对矿物油的研究取得了一定的成果, 如叶舟等[5]对汽油、 柴油、 润滑油、 煤油与原油五种油膜的光谱反射率进行研究, 发现油膜的光谱反射特性与油品类型以及油膜的厚度有关; 刘丙新等[6]采用反射光谱实现了对煤油、 润滑油、 轻柴油、 180#柴油四种油膜种类的鉴别; Reuben N Okparanma等[7]研究了受污染土壤的漫反射光谱与油分浓度、 土壤粘度、 土壤湿度的关系; Lammonglia等[8]对原油、 油膜以及乳化油的反射光谱进行了获取与分析, 指出了轻质组分在光谱特征表现上的作用, 并发现在不同状态时都具有可见光-近红外的光谱特征。 然而目前采用反射光谱研究润滑油污染程度的文章还未见报道。 反射光谱方法不但具有光学检测方法的共同优点, 例如, 样品不需要前处理即可进行无损测量, 而且更容易实现原位、 实时、 在线的检测, 在润滑油在线监测技术方面有很好的应用前景。
宽带光在液体样品表面入射时会进入到样品内部一定深度, 样品在入射光的波长范围内有选择的吸收使反射光强度受到差异性减弱, 从而实现样品反射光谱的测量并获得其化学成份信息[9]。 实验得到的反射光谱数据除了包含有用信息外, 常包含一定水平的噪声和冗余信息[10], 因此, 建立一个稳定、 准确的污染浓度光谱预测模型尤为重要。 本文在稀疏采样的基础上, 采用反射光谱技术, 结合相关系数法、 主成分分析法等优势特征波长提取方法建立污染浓度-光谱反射率关系模型, 实现了润滑油污染浓度的准确估计。
1 实验部分
1.1 材料与仪器
实验材料选用纯净润滑油和工作逾期的污染油, 并把污染油与纯净油使用等体积法逐步混合, 得到了污染浓度依次为0.5, 0.25, 0.125, 0.062 5, 0.031 25, 0.015 625的样品, 连同污染油(浓度标定为1)和纯净油(浓度标定为0)装入样品容器(比色皿阵列)中待用。 光谱测量设备采用美国海洋光学公司的S2000微型光谱仪; 光谱响应范围为200~850 nm, 分辨率为1 nm; 实验所使用的辅助器具有各种规格玻璃容器(烧杯, 量筒, 滴定管等)。
1.2 方法
将样品放置在暗室内, 采用光谱仪专用脉冲氙灯PX-2为激发光源, 调整好光纤探头与样品之间的距离及方位角并保持不变, 对样品进行反射光谱测量实验。 实验系统方框图如图1所示。
图1 实验系统方框图
Fig.1 Block diagram of experimental system
数据采集前将仪器设置为自动进行暗电流校正, 考虑到仪器本身的稳定性, 通过光谱仪参数设置, 对每个样品进行多次光谱重复测量, 将测得的光谱强度取其平均值作为该样本的反射光谱强度测量值。 由于仪器本身测量范围及端点效应的限制, 实验采用了220~780 nm范围内的测量光谱。
2 结果与讨论
2.1 数据描述
实验得到八种不同污染浓度润滑油的光谱数据, 采用MATLAB软件编程, 得到不同浓度污染润滑油光谱反射强度随波长变化曲线, 如图2所示。
由图2的初步观察可知, 润滑油的污染浓度越高, 反射光谱的强度越低。 润滑油污染浓度与光谱反射率的关系还需要进一步分析讨论。
2.2 反射率计算
反射率通常指目标物体表面反射光通量与入射光通量的比值, 它可以用来表征被测物体的反射特性。 对同一光源照射下的不同种类或浓度的样品, 入射光通量相同, 但由于不同样品的光谱反射特性不同, 因此不同波长上的反射光通量不同, 光谱仪输出光谱函数就不同。
本文采用比值法计算润滑油的光谱反射率, 具体计算方法如式(1)所示
(1)
式(1)中,DN1(λ)和DN2(λ)分别表示光谱仪输出的目标光谱函数和参考目标光谱函数;R1(λ)为观测目标光谱反射率,R2(λ)为参考目标的光谱反射率。 本文实验中选用了反射率接近1的标准反射板为参考目标。 在对数据卷积平滑预处理后, 采用反射率计算式(1)得到各浓度反射光谱的反射率, 如图3所示。
图2 不同浓度污染润滑油光谱 反射强度随波长变化曲线
Fig.2 Curve of lubricants spectral reflection intensity at different concentrations of pollution
图3 不同浓度污染润滑油反射率随波长变化曲线
Fig.3 Curve of lubricants spectral reflectance at different concentrations of pollution
2.3 变步长稀疏采样
变步长稀疏采样算法是根据斜率变化的快慢确定采样的细密程度, 即当瞬时斜率大的时候, 信号变化快, 信息含量较大, 需用较多的数据表示出来; 当瞬时斜率小的时候, 表明此段信号变化缓慢, 信号比较稳定, 用较少的数据就能表示出来。 变步长采样的实质就是消减信息中存在的冗余。
设给定n个实验数据, 通过变步长采样选取m个稀疏点拟合原始数据, 从而重构原始信息[11-12]。 采用MATLAB画出m=200时的纯净润滑油原始光谱反射率数据点与重构的拟合曲线如图4所示。
由图4可见, 拟合曲线通过了几乎所有实验数据点, 效果很好, 而这时的采样数据已减小为原始数据量的11.83%。 因此, 变步长稀疏采样算法实现了数据压缩, 提高了计算效率。 在一定意义上, 它是一种自适应压缩冗余信息, 更接近信息本质的算法(变步长稀疏采样算法过程将另文详细介绍)。
图4 原始数据点与重构的拟合曲线
Fig.4 Original data points and the reconstructed fitting curve of lubricants spectral reflectance
2.4 基于优势波长选取的回归模型
2.4.1 相关系数法优势波长建模
(1)相关系数法选取优势波长
通过相关系数法计算润滑油反射率与污染浓度两个向量间关系的紧密程度。 相关系数r由下式计算
(2)
其中,为波长点数;i=1, 2, …,n,n为样品数。
MATLAB软件编程计算出采样光谱反射率和污染浓度的相关系数随波长变化曲线, 如图5。
图5 润滑油反射率与杂质浓度 相关系数随波长变化曲线
Fig.5 Correlation curve of spectral reflectance and contaminant concentration
由图5可见, 在短波段浓度与反射率的相关系数绝对值较大, 长波段的相关系数绝对值较小, 并且浓度与反射率呈负相关, 即污染浓度越大, 光谱反射率越小。
(2)回归模型
润滑油反射率和污染浓度的相关系数最大值对应的波长在240.37 nm处, 采用MATLAB工具箱中的nlinfit函数建立一元非线性回归模型, 得到润滑油污染浓度c和反射率r的回归方程为
c=3 520.9e-171.0r
(3)
回归方程曲线如图6所示, 回归模型均方根误差为0.074 4。
图6 基于相关系数法润滑油回归方程曲线
Fig.6 Lubricant regression curve based on the correlation coefficient
2.4.2 主成分分析法优势波长建模
(1)主成分分析法选取优势波长
主成分分析(PCA)的基本思想是, 找到一个定义原始数据最大方差方向的正交坐标系, 通过这个新坐标系将高维数据以尽可能少的信息损失投影到低维空间, 找到更少的变量表示原始数据。 本文采用PCA选取优势波长。
F=PT
(4)
式(4)中,P为主成分,T为得分向量。 利用MATLAB函数princomp计算得到第一主成分P1的贡献率为99.054 8%, 故按照不低于95%的累积贡献率选取了第一主成分P1。
(2)回归模型
由主成分分析法得到贡献最大的波长为551.82 nm, 同样采用MATLAB工具箱中的nlinfit函数建立一元非线性回归模型, 得到润滑油污染浓度c和反射率r的回归方程为
c=1 789.4e-44.0r
(5)
回归方程曲线如图7所示, 回归模型均方根误差为0.035 8。
图7可见, 采用PCA选取的优势波长所建立的模型比相关系数法选取的优势波长所建立的模型效果要好。
2.4.3 主成分-相关系数法优势波长建模
(1)主成分分析法与相关系数法结合选取优势波长
将主成分分析法和相关系数法结合(为了叙述方便, 简称PCA-CC方法), 可以使优势波长的选择更加严谨而对不同物质具有普适意义。 由2.4.1和2.4.2节可知, 相关系数法和主成分分析法选取优势波长是在220~780 nm宽范围进行的, 跨度较大, 影响了建模精度。 考虑到样品内在光谱机理和实际探测中优势波长的支撑作用, 有必要进行波长分段分析。 结合图3将宽波段220~780 nm的波长分为三段进行分析, 第一段为220~380 nm, 第二段为380~580 nm, 第三段为580~780 nm。 采用PCA提取出每一段贡献最大的波长分别为378.93, 551.82和617.38 nm, 并且采用相关系数法得到三个波长的相关系数, 然后对三个波长分别建立一元非线性回归模型, 得到回归模型的均方根误差, 如表1所示。
图7 基于主成分分析法润滑油回归方程曲线
Fig.7 Lubricant regression curve based on PCA
表1 优势波长的相关系数和均方根误差
Table 1 Correlation coefficient and root mean square error of dominant wavelength
由表1可见在波长378.93 nm处的润滑油污染浓度与反射率的相关性最大, 所建立的回归模型均方根误差最小, 即378.93 nm波长处所建立的模型效果最好。 故选取的优势波长为378.93 nm。
(2)回归模型
在波长378.93 nm处采用MATLAB工具箱中的nlinfit函数建立一元非线性回归模型, 得到润滑油污染浓度c和反射率r的回归方程为
c=2 668.1e-78.3r
(6)
回归方程曲线如图8所示。
2.5 模型预测性能测试对比
用上述所建回归模型对预测集进行测试, 用均方根误差作为评价指标, 所得结果如表2所示, 其中RMSEP1是校正模型的均方根误差, RMSEP2是预测均方根误差。
由表2可见, 在宽带波长范围内分段分析, 并且采用PCA-CC提取优势波长, 得到378.93 nm波长建立的模型比其他方法所建模型有更好的预测效果。 预测集的预测效果图见图9。
图8 基于主成分-相关系数法润滑油回归方程曲线
Fig.8 Lubricant regression curve based on PCA-CC
表2 模型预测效果比较
Table 2 Comparison of the effect of model prediction
图9 基于主成分-相关系数法模型预测效果图
Fig.9 Model prediction renderings based on PCA-CC
润滑油污染浓度真实值与预测值的误差, 如表3所示。
表3 预测值与真实值的误差
Table 3 Error between the predicted values and actual values
由图9和表3可知, 当浓度大于0.06时, 润滑油污染浓度与光谱反射率的指数回归模型能够较好地实现润滑油污染浓度的预测和估计。
紫外-可见宽波段反射光谱具有信息丰富、 非接触性获取、 检测速度快、 精确度高等优点, 便于实现润滑油污染程度的原位、 实时、 在线检测, 并且样品不需要前处理即可进行无损测量。 但是, 反射光谱对入射条件敏感, 实验过程中探头与样品之间的距离及方位角的稍微变动都会影响到润滑油的准确测量, 因此, 必须保持探头与样品的位置和方位角固定不变。 另外, 反射光谱仅来自探测点处的液体表层, 故不适于非均匀样品的测量。
3 结 论
反射光谱实验结果表明, 润滑油的污染浓度越高, 反射光谱的强度越低。 采用主成分分析法和相关系数法相结合, 分段选取了三个优势波长, 可用于工作润滑油的定性定量分析。 在378.93 nm波长处建立了润滑油污染浓度与反射率关系的指数模型。 该模型精度较高、 预测效果较好, 实现了润滑油污染程度的定量估计。 本文基于光谱实验数据所建立的污染润滑油反射光谱-浓度关系模型, 因其混合介质及其浓度的特异性条件, 不服从低浓度均匀透明溶液中的朗伯-比尔定律, 适用于较高污染浓度下的润滑油质量状态估计, 对于润滑油工作状态的反射光谱法在线监测具有一定的实验基础意义和参考价值。