近红外光谱与模型集群分析测定 毛涤混纺织物成分含量 ·...

4
近红外光谱与模型集群分析测定 毛涤混纺织物成分含量 1 吴淑焕 1 聂凤明 1 1 2 梁逸曾 3 渊1. 广州纤维产品检测研究院国家纺织品服装服饰产品质量监督检验中心广州冤袁广东 广州 511447曰 2. 湖南农业大学生物科学技术学院湖南 长沙 410128曰 3. 中南大学化学化工学院湖南 长沙 410083冤 将近红外光谱法和模型集群分析方法应用于毛涤混纺织物成分含量的快速无损测定以近红外测量方法采 93 个毛涤混纺织物的光谱信号利用光谱预处理消除信号漂移的影响在模型集群分析基础上剔除异常样本选出 30 个关键波长采用偏最小二乘法渊PLS冤建立涤纶含量的预测模型所建立模型的训练集相关系数 r 2 0.982 7尧 交互验证均方误差渊RMSECV冤3.26尧预测均方根误差渊RMSEP冤3.34袁预测结果令人满意适合于毛涤混纺织物中 涤纶含量的快速无损检测关键词近红外光谱模型集群分析毛涤混纺织物偏最小二乘法 文献标志码A 文章编号1674-5124201608-0044-04 Study on rapid determination of polyester content in polyester/wool based on near infrared spectroscopy and model population analysis LUO Jun 1 袁 WU Shuhuan 1 袁 NIE Fengming 1 袁 XU Min 1 袁 FAN Wei 2 袁 LIANG Yizeng 3 渊1. Guangzhou Fibre Product Testing and Research Institute袁Guangzhou 511447袁China曰 2. College of Bioscience and Biotechnology袁Hunan Agricultural University袁Changsha 410128袁China曰 3. College of Chemistry and Chemical Engineering袁Central South University袁Changsha 410083袁China冤 Abstract: Near-infrared spectroscopy as a rapid袁 non-destructively testing technique袁 has been widely used in the fiber product testing field. 93 polyester/wool samples were collected. Model population analysis method was employed to detect the outlier and select key variables after preprocessing the spectra by Savitsky -Golay derivative method. Partial least squares 渊PLS冤 calibration models were established by the optimal conditions to predict the content of polyester. Correlation coefficient of determination r 2 袁 root-mean-square error of cross-validation 渊RMSECV冤 and root-mean-square error of prediction渊RMSEP冤 were used to evaluate the quality of the model. The best models showed satisfactory predictions as measured by the r 2 RMSECV and RMSEP values: 0.982 7袁 3.26 and 3.34. The prediction results were better than the whole spectra The results showed that the method was suitable for the fast and reliable determination of the content of polyester in polyester/wool product. Keywords: near-infrared spectroscopy曰 model population analysis曰 polyester/wool曰 PLS 收稿日期2015-12-28收到修改稿日期2016-02-19 基金项目国家自然科学基金项目渊21275164冤曰国家质检总局科技计划项目渊2013QK290冤曰广州市海珠区科技计划项目渊2013-cg-08冤 作者简介渊1983-冤袁广东广州市人博士主要从事纺织品检测新技术研发新型检测仪器研发工作通信作者渊1983-冤袁河北邢台市人博士主要从事光谱分析与化学计量学研究中国测试 CHINA MEASUREMENT & TEST Vol.42 No.8 August2016 42 卷第 8 2016 8 doi10.11857/j.issn.1674-5124.2016.08.009

Upload: others

Post on 23-Sep-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

近红外光谱与模型集群分析测定毛涤混纺织物成分含量

罗 峻 1袁 吴淑焕 1袁 聂凤明 1袁 许 敏 1袁 范 伟 2袁 梁逸曾 3渊1. 广州纤维产品检测研究院袁国家纺织品服装服饰产品质量监督检验中心渊广州冤袁广东 广州 511447曰2. 湖南农业大学生物科学技术学院袁湖南 长沙 410128曰 3. 中南大学化学化工学院袁湖南 长沙 410083冤

摘 要院将近红外光谱法和模型集群分析方法应用于毛涤混纺织物成分含量的快速无损测定遥 以近红外测量方法采

集 93 个毛涤混纺织物的光谱信号袁利用光谱预处理消除信号漂移的影响袁在模型集群分析基础上袁剔除异常样本袁筛选出 30 个关键波长袁采用偏最小二乘法渊PLS冤建立涤纶含量的预测模型遥 所建立模型的训练集相关系数 r2 为 0.9827尧交互验证均方误差渊RMSECV冤为 3.26尧预测均方根误差渊RMSEP冤为 3.34袁预测结果令人满意袁适合于毛涤混纺织物中

涤纶含量的快速尧无损检测遥关键词院近红外光谱曰模型集群分析曰毛涤混纺织物曰偏最小二乘法

文献标志码院A 文章编号院1674-5124渊2016冤08-0044-04

Study on rapid determination of polyester content in polyester/wool based on nearinfrared spectroscopy and model population analysis

LUO Jun1袁 WU Shuhuan1袁 NIE Fengming1袁 XU Min1袁 FAN Wei2袁 LIANG Yizeng3

渊1. Guangzhou Fibre Product Testing and Research Institute袁Guangzhou 511447袁China曰2. College of Bioscience and Biotechnology袁Hunan Agricultural University袁Changsha 410128袁China曰3. College of Chemistry and Chemical Engineering袁Central South University袁Changsha 410083袁China冤

Abstract: Near-infrared spectroscopy as a rapid袁 non-destructively testing technique袁 has beenwidely used in the fiber product testing field. 93 polyester/wool samples were collected. Modelpopulation analysis method was employed to detect the outlier and select key variables afterpreprocessing the spectra by Savitsky -Golay derivative method. Partial least squares 渊PLS冤calibration models were established by the optimal conditions to predict the content of polyester.Correlation coefficient of determination r2袁 root-mean-square error of cross-validation 渊RMSECV冤and root-mean-square error of prediction渊RMSEP冤 were used to evaluate the quality of the model.The best models showed satisfactory predictions as measured by the r2袁 RMSECV and RMSEPvalues: 0.982 7袁 3.26 and 3.34. The prediction results were better than the whole spectra Theresults showed that the method was suitable for the fast and reliable determination of the contentof polyester in polyester/wool product.Keywords: near-infrared spectroscopy曰 model population analysis曰 polyester/wool曰 PLS

收稿日期院2015-12-28曰收到修改稿日期院2016-02-19基金项目院国家自然科学基金项目渊21275164冤曰国家质检总局科技计划项目渊2013QK290冤曰广州市海珠区科技计划项目渊2013-cg-08冤作者简介:罗 峻渊1983-冤袁男袁广东广州市人袁博士袁主要从事纺织品检测新技术研发尧新型检测仪器研发工作遥通信作者院范 伟渊1983-冤袁男袁河北邢台市人袁博士袁主要从事光谱分析与化学计量学研究遥

中国测试CHINA MEASUREMENT & TEST Vol.42 No.8August,2016第 42 卷第 8 期2016 年 8 月

doi院10.11857/j.issn.1674-5124.2016.08.009

第 42 卷第 8 期

0 引 言当前袁我国的纺织品生产尧出口和消费均居世界

第一遥 所以无论是政府监管还是企业自检自控袁纺织品成分检测的规模都非常巨大遥 然而袁传统的纺

织品成分检测方法如化学溶解法和显微镜法等袁存在检测时间长袁检测环境要求高尧使用强酸强碱

试剂袁检测成本高袁需破坏样品等缺点袁无法满足各

检验监督部门袁包括生产企业对纺织品进行大量检

测的需求[1-4]遥在这种情况下袁部分不法企业擅自降低

混纺面料中某些纤维成分的含量袁偷工减料袁以次充

好袁牟取不当利润袁造成不良影响遥 由近期全国各地

公布的质量状况分析结果可看出袁不合格纺织品中成

分及含量与实际不符的问题最为严重[5]遥基于以上需求袁研究和开发一种快速尧无损尧环

境友好的检测方法具有很好的应用前景遥 近红外光

谱渊NIR冤是一种无损分析技术[6]袁它将近红外光谱信

号与化学分析数据袁利用统计回归方法建立预测模

型袁然后测量未知样品的光谱来快速预测其成分含

量[7-8]遥 质检部门可利用近红外快速检测技术进行初

步筛查袁对于快检不合格的情况袁依法启动抽样检验

程序袁实现对纺织品企业尧原材料加工厂尧成衣加工

厂以及批发零售终端等大批量的抽检袁充分保证国内

纺织品的质量[9-10]遥当前袁已有关于近红外光谱技术应用于纺织品定

量分析中的报道袁但相关的研究主要集中在棉/涤尧棉/氨等混纺织物[1袁3袁8-9]袁毛涤混纺织物报道较少遥 另

外混纺织物近红外光谱检测的目标在于建立一个有

效可靠的预测模型袁实现对未知样本的含量预测遥 在

实际工作中袁这个模型的建立并不容易袁由于模型完

全未知袁建模需要进行探索袁并且需要解决异常样本尧干扰信息等问题遥传统的一次性建模思路容易陷入模

型欠拟合与过拟合的状况遥而新进发展的模型集群分

析打破了传统一次性建模思路袁力求最大限度地利用

已有样本信息袁通过随机采样袁从样本空间尧变量空间

或是模型空间考察数据集的内在性质袁基于所得结果

的统计分析可进行异常样品的检测尧关键波长的筛选

和模型的评价等[11-12]遥基于此袁本研究共收集毛涤混纺

织物样本共 93 个袁建立了基于模型集群分析的毛涤

混纺织物组分含量的近红外光谱快速无损检测方法遥1 材料与方法1.1 样 本

本实验研究的毛涤混纺织物样本共计 93 个袁均为市场购买成品样本遥 成分含量按照标准 FZ/T 01057系列进行定性鉴别袁按照国家标准 GB/T 2910 系列

进行成分含量定量分析遥1.2 光谱信号的采集

信号采集来源为近红外光谱仪渊ANTARIS II袁Thermo fisher冤袁样品采用漫反射方式测量袁为保证

样品信号的代表性袁 每个样品测量 3 次并取 3 次平

均值作为其光谱信号数据袁信号采集时室内温度为

20益袁湿度为 60%遥1.3 方法与原理

模型集群分析遥 模型集群分析的算法框架主要包

括 3 个基本要素院1冤通过随机采样获取子数据集曰2冤针对每个子数据集袁建立相应子模型曰3冤从样本

空间尧变量空间尧参数空间或模型空间对所有建立的

集群子模型的参数与结果进行统计分析袁获取有用

信息[13]遥应用该算法框架可以进行异常样品的检测尧关

键波长的筛选和模型的评价遥 基于模型集群分析的

异常样本识别方法可克服不同异常样本的掩蔽效

应袁有效识别光谱信号及化学分析数据的异常值遥具

体算法如下院采用随机分组的方式袁将样本集分为

70%的训练集和 30%的测试集遥 采用训练集样本建

立回归模型并对测试集样本进行预测袁重复该过程

多次渊本研究为 3 000 次冤袁可得每个样本预测误差的

统计分布袁 计算每个样本的残差分布均值 滋 和标准

偏差 匾 并作图袁预测误差分布的均值或偏差异常的

样本即被识别为异常样本[14]遥基于模型集群分析的波长筛选方法可显著提高

近红外分析预测的准确度遥 因为近红外光谱数据的

共线性非常严重袁其波长点数为几百个至上千个遥如

此多的波长点数不仅存在着信息的冗余袁而且部分波

长的信号可能为干扰信息袁对预测不利遥 因此袁在建

立预测模型时也需要对近红外光信号进行波长的筛

选遥对于毛涤混纺织物的关键波长筛选袁我们设计了

一种基于模型集群分析的新方法院MPA-PSO 方法遥PSO渊粒子群优化冤是一种源于对鸟群捕食行为研究

的进化计算技术[15]遥 是一种基于叠代的优化工具袁系统初始化为一组随机解袁在解空间通过叠代搜寻最

优值遥 在 PSO 中袁每个优化问题的潜在解都可以想

象成 D 维搜索空间上的一个点袁可称之为野粒子冶袁所有的粒子都有一个被目标函数决定的适应值袁每个粒

子还有一个速度决定他们飞翔的方向和距离袁然后

粒子们就追随当前的最优粒子在解空间中搜索遥PSO 方法实现较为简便袁本研究基于模型集群分析

框架袁通过随机采样袁获得不同的子数据集袁然后对

每个数据集进行 PSO 关键波长筛选袁根据选出波长

的频率来确定最终关键波长遥

罗 峻等:近红外光谱与模型集群分析测定毛涤混纺织物成分含量 45

中国测试 2016 年 8 月

1.4 数据处理

本文所采用的光谱信号处理及回归等程序均在

Matlab R2015b 环境下运行遥2 结果与分析2.1 样本的划分

在多元校正模型的建立及验证时袁需要将数据

样本划分为训练集和独立测试集遥 训练集用来优化

参数建立模型袁独立测试集不参与建模过程袁仅用来

验证模型的预测效果遥 本文采用 Kenard-Stone 样本

选择方法袁从总计 93 个毛涤织物样本中筛选出具有

代表性的 80 个样本用于训练模型袁13 个样本用于

测试模型遥2.2 光谱的预处理

在进行混纺织物的近红外光谱检测时袁一般采用

积分球漫反射的模式测量遥 测量过程中虽然尽量保

持了环境条件的一致袁但是混纺织物其表面结构尧平整性尧厚度等不同因素会干扰光谱信息遥从图 1 中亦

可以看出袁近红外信号的漂移非常严重袁对近红外光

信号进行适当预处理可以干扰因素引起的信号漂移

及旋转等噪声袁从而提高信噪比袁为建立预测模型提

供有效信息遥 在本研究中袁 选择 5 点 2 次多项式

Savitsky-Golay 一阶微分法进行处理袁处理后光谱如

图 2 所示遥 对比图 1 和图 2 可看出袁经过预处理后袁明显消除了信号的整体漂移袁强化了谱带特征袁处理

后的光谱更适宜于预测模型的建立遥2.3 异常样本的检测

依据模型集群分析的思路袁为最大限度地利用

已有训练集样本信息袁可通过随机采样袁从样本空间

考察数据集的内在性质袁根据所得结果的统计分析

进行异常样品的检测遥因此在本研究中袁采用随机分

组方法对训练集重复进行分组袁每次取总数 70%的

样本来回归预测模型袁30%进行测试遥重复 3 000 次袁

每个样本均得到多个预测值遥 计算多个预测值误差

的平均值与标准方差并绘图袁如图 3 所示遥可以看出袁有样本预测误差均值明显偏高袁如 13 号样本遥 或是

预测误差的方差较大袁如 34 及 77 号样本遥 经验证袁13 号样本为机织黑色布料袁其表面具有装饰嵌条袁34 号样本为混色格子布料袁77 号样本为呢料袁表面起

圈不平整遥将此 3 个异常样本剔除后建立回归模型袁并与全样本预测模型作了比较袁剔除后袁交互验证均

方根误差渊RMSECV冤由全样本的 5.27 降低到 4.62袁预测的准确度明显提高遥2.4 关键波长优选

近红外光谱信号存在较为明显的信息冗余袁因此通过优选波长可以提高模型的预测能力与适用

性遥 本研究采用 MPA-PSO 法对毛涤混纺织物的关

键波长进行筛选袁PSO 具有深刻的智能背景袁同其他

优化算法比较袁PSO 简单易实现且没有过多参数需

要调整遥运行时首先设置粒子群搜索参数院粒子种群

大小为 50袁迭代次数为 200袁算法运行 10 次袁以 F=Q2

作为适应度函数袁Q2 为交互验证预测值和量测值的图 1 毛涤混纺织物的近红外光谱图

0.5

0

1.0

1.5

4 000 5 000 6 000 7 000 8 000 9000 10 000波数/cm-1

图 2 毛涤混纺织物的一阶微分光谱图

4 000 5 000 6000 7 000 8000 9000 10 000-0.025-0.020-0.015-0.010-0.005

00.0050.0100.0150.0200.025

波数/cm-1

图 3 均值―方差分布图

0 2 4 6 8 10 12 14 16 18 20MEAN

12345678

77

34

13

52

41

10551275

699 70

11

2219

45271588

52342719733081

1485343

5478

45663

3220 3349

4725827654779

448018683883742663551

17 6156876621

1819 12161514 374037

46

第 42 卷第 8 期

相关系数遥 重复选择 3 000 次后袁对选出的波长进行

统计分析袁 最终选择频率大于 50%的 30 个波长

作为其关键波长遥30 个关键波长具体为院4 034袁4 177袁4204袁4 281袁4 756袁4 968袁4 972袁4 975袁5 095袁5 099袁5 103袁5 295袁6 044袁6 113袁6 117袁6 144袁6 198袁8 632袁8 748袁8 751袁9 118袁9 280袁9 338袁9 507袁9 608袁9 635袁9 696袁9 700袁9 800袁9 812 cm-1遥

利用 30 个关键波长建立预测模型的结果表明袁经过波长筛选后袁预测误差有所降低袁关键波长预测

模型的交互验证均方差值为之前的 70.4%遥 而且袁波长数量由原始的 1557 个减少到 30 个袁减少了数据处

理的工作量袁可见 MPA-PSO 法应用于波长筛选来处

理近红外信号可有效简化模型并提高校正模型的预

测能力遥2.5 模型建立与预测

采用未参与模型建立的独立测试集样本对模型

的预测效果进行测试和验证遥 首先采用预处理方法

对样本信号进行处理袁然后调用训练集样本建立PLS模型袁并对未参与建模的独立测试集样本进行预测袁回归模型的测试集相关系数为0.982 7袁预测均方根

误差为 3.34袁交互检验均方差为 3.26袁结果令人满意遥近红外预测值与化学分析测定值之间的相关关系

如图4 所示遥

3 结束语基于近红外光谱和模型集群分析对毛涤混纺织

物中涤纶含量进行了快速无损检测研究袁在模型集群

分析框架下袁剔除了一些异常样本袁并筛选出了关键

波长袁利用关键波长进行偏最小二乘回归建模袁预测

误差较小袁表明近红外光谱结合模型集群分析适合

于毛涤混纺织物中纤维成分的快速尧无损检测袁而且

能达到令人满意的检测精度袁为今后混纺织物的快速

无损检测提供了新的选择遥同时袁在本研究中注意到混纺织物样品复杂度较

大袁成分含量跨度同样较大袁下一步计划开展分段动

态建模研究袁以进一步提高预测准确率遥参考文献

[1] 桂家祥袁耿响袁要磊袁等. 基于近红外光谱法的棉/涤混纺

纺织物中棉含量快速检测[J].纺织学报袁2012袁33渊4冤院55-59.[2] 王京力袁耿响袁桂家祥. 基于近红外光谱法快速检测涤氨

织物的纤维含量[J]. 上海纺织科技袁2013袁41渊5冤院45-48.[3] 钟浩袁杨伟江. 运用近红外光谱定量分析纺织面料成分的

可行性探讨[J]. 中国纤检袁2008渊2冤院46-47.[4] 冯红年袁甘彬袁金尙忠. 棉涤混合纺织面料含量的近红外

光谱检测[J]. 激光与红外袁2005袁35渊10冤院768-770.[5] 虞学锋. 服装产品纤维成分含量项目质量状况分析[J].

中国纤检袁2014渊10冤院28-29.[6] 陆婉珍. 现代近红外光谱分析技术[M]. 北京院中国石化出

版社袁2006.[7] 梁逸曾. 白灰黑复杂多组份分析体系及其化学计量学算

法[M]. 长沙院湖南科学技术出版社袁1996院32-36.[8] 王动民袁金尙忠袁陈华才袁等.棉-涤混纺面料中棉含量的近

红外光谱分析[J].光学精密工程袁2008袁16渊11冤院2051-2054.[9] 朱洪亮袁杨萌袁张琦. 棉/氨混纺织物氨纶含量快速分析方

法研究[J]. 中国纤检袁2011渊24冤院54-58.[10] 耿响袁桂家祥袁要磊袁等. 近红外光谱快速检测技术在纺织

领域的应用[J]. 上海纺织科技袁2013袁41渊4冤院25-27.[11] 王京力袁桂家祥袁耿响袁等. 近红外光谱检测用纤维含量样

品准确度研究[J]. 上海纺织科技袁2013袁41渊9冤院51-54.[12] 柴金朝袁金尙忠. 光谱预处理对棉涤混纺面料近红外定量

模型的影响[J].中国计量学院学报袁2008袁19渊4冤院325-328.[13] 梁逸曾袁许青松. 复杂体系仪器分析-白灰黑分析体系及

其多变量解析方法[M]. 北京院化学工业出版社袁2012.[14] CAO D S袁 LIANG Y Z袁 XU Q S. A new strategy of

outlier detection for QSAR/QSPR[J]. Journal of Compu鄄tational Chemistry袁2009袁31渊3冤院592-602.

[15] KHAJEH A袁 MODARRESS H袁 ZEINODDINI-MEYMANDH. Application of modified particle swarm optimization asan efficient variable selection strategy in QSAR/QSPRstudies[J]. Journal of Chemometrics袁2012袁26渊11-12冤院598-603.

渊编辑院徐柳冤

图 4 真实值与近红外预测值之间的相关图

0 10 20 30 40 50 60 70 80涤纶含量实际值/%

102030405060708090

训练样本测试样本

罗 峻等:近红外光谱与模型集群分析测定毛涤混纺织物成分含量 47