- 相关推荐
样品年份、化学值分布参数对近红外检测结果的影响
摘要:以云南优质烤熠为实验材辑。在国产光栅漫反射型近红外仪器上,比较研究了不同年份样品建模、不同化学值分布建模对近红外检测结果的影响。结果表明:总糖、尼古丁组分模型偏差受年份影响较大,总氮组分模型偏差与样品年份关系不明显。烤烟组分的不同化学值分布建模结果表明:用化学值按自然正态分布的样品建立模型的结果优于按均匀分布建模的结果。该研究对从大量天然产物样品中挑选代表性样品时所采用的挑选方法和原则具有指导性的参考价值。
关键词:近红外 烤烟 样品年份;化学值分布
引言
近红外谱区包含了生物样品各种组分的物理、化学信息。近红外分析可概述为样品化学组分与物理信息间的数学表达,而该数学表达即近红外数学模型的优劣在很大程度上取决于建立该数学表达时所采用样品的代表性[1铂。特别是建立天然产物近红外数学模型时,建模样品的年份、品种、产地以及组分模型的化学值分布等情况都会影响建模样品的代表性和所建模型的性能口]。
c00per等研究了年份变化对关系模型的影响及处理办法,结果表明,使用早年烟叶建立尼古丁关系模型后.直接测试新年份烟叶时,准确度会有所降低,但模型中适当加入新年份烟叶标样后,检测准确度即可得到保证,但该研究结论未进行公开发表,其他烤烟组分模型与年份关系也未见报道。烟草吉氮量的研究结果表明,不同烟草的总氮变化量随种类有较大的变化,一般烤烟的总氮变化不大,白肋烟的总氟变化最高【5]。本文中主要以尼古丁和总氮组分含量为例研究了年份变化对烤烟模型的影响及处理办法。
建立天然产物近红外数学模型时为保证建模样品的代表性,一般要求其建模组分的化学值范围(或动态范围)应尽可能大,即尽量收集到含量较低和较高的样品类型。但对其化学值分布情况的要求在近红外分析界存在一定的争议,是均匀分布好还是正态分布好并无定论,也未有明确结论的文献报道。本文通过模拟设计多组均匀及正态分布建模结果的比较,对该问题进行了初步的探索研究。
1、实验材料与方法
1.1实验材料
2004年云南各地优质烤烟样品122份,2005年云南各地优质烤烟样品100份,样品由云南烟草科学研究所应用流动注射自动分析仅测定其总糖、尼古丁含量,应用国标凯氏定氮法测定其总氯含量。
1.2实验仪器
实验所用仪器为鼬oo型光栅积分球漫反射近红外光谱仪(上海棱光公司、中国农业大学合作开发研制),信噪比(s/^D≥1 000;波长准确度≤1 nm}光谱扫描区间为1 300~2 100啪,分辨率为16 nm;S400型仪器上配备近红外烟草品质定量分析专用软件。
2、结果与分析
2.1样品年份差异
对近红外检测结果的影响将2005年云南各地优质烤烟样品100份随机分为两组,每组各50份,其中第l组样品用于和2004年样品一起建立包含不同年份样品的模型,第2组样品用于分析检验。用不同年份样品所建模型对第2组2005年50份样品的分析预测结果情况见表1,其中“模型1”指全部为2004年样品建立的数学模型,。模型2”指2004年样品加2005年第1组50个样品共同建立的数学模型。
总糖和尼古丁组分模型在加人2005年第1组样品后预测2005年第2组样品的准确度,要明显好于全为2004年样品的模型,因此这两个组分模型与样品年份差异存在一定的关系,在建立该两组分近红外品质分析实用模型时应包含样品年份差异的信息,而尼古丁组分模型的性能与样品年份差异之间的关系却并不明显。其原因可能与云南地区烟草品质特点和质量控制措施有关。
2.2样品化学值分布
对近红外检测结果的影响2004年从云南各地收集的122份烤烟样品总糖化学值含量的分布情况见图1,从图1中可以看出其总糖化学值含量的分布为近似的正态分布。在分析仪器中建立单白变量的标准曲线(即为定标方程或简单敷学模型)时一般要求所建定标方程样品的化学值含量为均匀分布,建立近红外数学模型时,样品化学值含量分布的要求还没有确定的结论,是遵循均匀分布还是正态分布好,不同的学者有不同的观点[1]。
对于一般天然产物各组分的化学值詈量一般是自然正态分布的口],如果建模时遵循均匀分布必须进行刻意的样品挑选,奉研究分别设计了55,40,25个样品总糖化学值按均匀分布的原则和正态分布原则建立了6个不同的数学模型,以及用04年所有样品建立的数学模型.此7个数学模型内部交叉验证的结果情况见表2。其中按正态分布设计的55,40,25个样品总糖化学值分布情况分男U见图2~图4,按均匀分布设计的55,40,25个样品总糖化学值分布情况见表3。
刻意的进行样品挑选使建模样品的化学值分布满足均匀分布的方法,并不一定能取得较好差,因此按其样品组分化学值的自然正态分布建模是可行的建模效果,相反比按自然正态分布所建模型的效果还要的,建模时模型内部交叉结果显着较差时(譬如两个不同分布的25个样品所建模型结果),该模型一定不是性能好的模型,但反之却不一定成立,从表2中25个样品建模的内部交叉平均误差可以看出,比122个样品建模的平均误差要小,这并不能说明25个样品所建模型比122个样品所建模型的效果还要好,因为建模样品数目的减少会降低模样品的代表性,同时降低所建模型的稳定性,要建立稳定性好的数学模型必须使用大的建模样品集或从大量样品中挑选有代表性样品建模型才可以实现伽。刻意追求化学值的均匀分布建模并不一定能取得较好的结果这一研究结论,对从大量样品中挑选代表性样品建模时所使用的挑选方法和原则具有重要的参考价值,即按样品的光谱或光谱主成分特征进行代表性样品挑选时,在不同特征区间范围内可不刻意遵循均匀分布的原则去挑选。
3、结论与讨论
通过以上研究,总结如下:
(1)烤烟中总糖、尼古丁组分模型的预测准确度与建模样品的年份差异存在一定关系,当模型中包含被预测样品的年份信息时其预测准确度会有所提高}总氮组分模型的预测准确度与样品年份信息的关系不大,因此对一些受气候、栽培措施等影响较大的天然产物组分建立模型时应考虑年份不同产生的影响。
(2)建立天然产物近红外定标方程模型时,按其样品组分化学值的自然正态分布建模是可行的,而刻意追求化学值的均匀分布建模并不一定能取得较好的结果。
(3)按样品的光谱或光谱主成分特征进行代表性样品挑选时,在不同特征区间范围内遵循均匀分布的原则去挑选.结果未必最优。
(4)云南地区烟草生产进行“控氮降碱”的质量控制措施,是否与总氮组分模型的预测准确度与样品年份信息的关系不大有关,还有待进一步研究,模型中样品产地等差异对近红外检测结果的影响程度还有待进一步研究。
致谢:本论文承蒙得到陆婉珍院士、严衍禄教授,蒋士强教授等的悉心审阅和指导,在此表示衷心的感谢和敬意。
【样品年份、化学值分布参数对近红外检测结果的影响】相关文章:
建筑材料检测中影响检测结果的因素07-21
尿液干化学分析仪检测结果影响因素探讨10-12
对建筑材料检测结果产生影响的因素及措施08-18
影响建筑材料检测结果的关键因素研究论文10-02
红外技术在电路故障检测中的应用09-16
慢性心衰对血小板参数的影响10-21
均匀分布的参数估计与假设检验问题05-14
电站压力参数的单片微机检测仪08-17
基于功能近红外光谱技术的脑机接口研究10-17