热门关键词:
油茶树是世界四大木本食用油料来源之一,主要生长在热带和亚热带地区,在我国有着悠久的栽培历史。用油茶树籽制得的茶油脂肪酸成分、脂肪特性和营养成分与橄榄油相近,因此被称为“东方橄榄油”。油茶籽粕也称油茶饼粕、茶饼、茶枯饼、茶粕、茶麸等,是经油茶籽压榨后的油茶籽饼浸出并去除溶剂所得。油茶籽粕是一种营养价值、使用价值和经济价值都比较高的副产品可用于动物饲料、清塘用料等;也可通过提取油茶籽粕中的生物活性物质,加工生产具有更高价值的产品还可以与化学试剂复配制成去污除菌清洁剂,起到清洁保洁、杀菌抑菌的作用。除了标准GB/T 35131-2017明确规定的水分、灰分和茶皂素等质量指标之外,油茶籽粕中还富含多糖、蛋白质等活性成分,具有抗氧化、抗菌、抗病毒等功能。
目前,油茶籽粕成分的检测主要依赖于常规化学分析方法,具有操作繁杂、耗时长、使用有毒有害试剂、易造成环境污染、对实验员要求高等特点,无法实现油茶籽粕的快速分类定级,不能满足相关监管部门大批量的抽检和现场监督需求。因此急切需要新型的快速检测技术。2015年,刘琦等人[13]利用含油浓度与相应液体油脂体系折光指数呈良好线性关系的原理,开发了一种快速检测油茶籽及饼粕含油率的方法。该方法虽然可以快速检测出含油率,但在实验中用到自制油料处理器、阿贝折射仪、微电脑恒温控制装置等多个设备,同时使用了有毒、易燃的有机物溴代萘,不利于广泛的推广应用。2015年,李刚等人[14]利用近红外光谱技术建立了茶粕中茶皂素含量的分析模型,随后又分别建立了含油量、蛋白质、水分[15][16]及总灰分[12]的分析模型,利用未参与模型建立的样品对模型进行了预测。预测结果与常规方法测定结果不存在显著差异,证明了该方法的可行性。近红外光谱分析技术具有快速、高效、环保等特点,可提高检测效率,满足企业、市场监管部门的技术要求,也为国家扩大油茶籽粕市场、建立国家质量监测体系提供技术支撑,便于广泛推广使用。
本文在介绍近红外光谱技术的基础上,详细阐述了该技术在油茶籽粕检测中的建模过程,并提出了近红外光谱技术在油茶籽粕指标模型开发建立、标准制定和模型共享中的发展趋势,为今后该技术在油茶籽粕检测中的应用和推广提供了技术支持和理论依据。
近红外光谱技术最早可追溯到20世纪50年代,首先应用于农副产品的分析,但局限于当时的技术水平,未能被广泛推广[17]。我国从20世纪80年代开始进行近红外光谱技术的研究和应用,20世纪90年代后逐渐将其应用到农业、制药、石油和食品等领域[18]。近红外光是介于可见光与中红外光之间(波长在780~2526 nm范围内)的电磁波。根据有机分子含氢基团(C--H、O--H、N--H等)的近红外吸收光谱出现的位置、吸收强度等特征,并结合化学计量学实现了待检测对象某一种或多种成分的定性或定量分析[19][20]。近红外光谱能够用于物质的定性判别,可通过比较未知样品与已知参考样品集的光谱来确定样品的归属,在油料作物、食品、药品掺伪检测以及产地鉴别等方面发挥着重要作用[21][22][23]。定量分析类似于定性分析,是一种间接分析手段,需根据建模样品的性质与组成选用合适的化学计量学方法建立校正模型,再通过对比未知样品的光谱图进行预测来实现定量分析[22]。
近红外光谱技术是基础测量技术、化学计量学技术、计算机技术和光谱测量技术的有机结合,是一种间接测定方法[20]。其样品分析的全过程可整体归结为校正和预测两个过程。首先采用常规检测方法对已选好的大量具有代表性样品的组分含量或性质进行测定,同时采集包含样品物理性质信息及样品组分与结构的化学信息的近红外光谱数据,再以化学计量学为桥梁,将近红外光谱数据和常规检测结果相关联,对样品进行定性定量分析,建立校正模型。模型建立后,采集未知样品光谱图并用已建立好的模型进行预测,得到样品的物理或化学性质参数。用验证集样品进行分析时,高质量的校正模型预测结果与实际结果应具有良好的一致性[14,20][14,20]。
近红外光谱技术在油茶籽粕检测中包括以下步骤:(1)收集与制备油茶籽粕样品;(2)采用常规分析法测定油茶籽粕的待检测成分含量;(3)根据油茶籽粕的性质和特点,选择最佳的扫描厚度和扫描次数等参数,然后采集样品的近红外光谱信息;(4)将近红外光谱与常规分析法结果相结合,利用化学计量学方法剔除不能用来建模的异常样品,建立相应的分析模型[15]。
油茶籽粕样品的收集与制备是油茶籽粕分析工作的重要环节,直接影响测定结果的准确性。将油茶籽粕样品粉碎后过40目筛,并将筛下物收集备用。测定油茶籽粕主要成分所采用的常规化学分析法分别为加热干燥法(水分)、热乙醇浸提-重量法(茶皂素)、凯氏定氮法(蛋白质)、索氏抽提-重量法(含油量)、高温灼烧法(灰分)。相应测试过程耗时长,分别为8~10 h、10~12 h、6~8 h、10~12 h、8 h。用到的高耗电设备(烘箱、水浴锅、马弗炉)及有毒有害强腐蚀性试剂(石油醚、硫酸)等,不利于操作人员的安全及环境的保护,难以实现油茶籽粕的快速分类定级[12][14][15][16]。
近红外光谱仪器的工作状态和采集光谱时的各个参数(如扫描次数及扫描光程的设定等)对样品定性定量结果均有较大影响[15]。通过增加扫描次数来削弱光谱噪声,可以提高仪器的信噪比以及近红外光谱仪的结果可靠性。但扫描次数达到上限时,对噪声的消减作用几乎为零。扫描光程也指样品填装厚度,对光谱采集有一定影响。厚度太小时无法确保样品所含信息的全面性,而厚度太大时则光谱噪声增大,影响分析结果。经研究[12][14][15][16]确定,油茶籽粕光谱采集时的最佳扫描次数为32次,最佳扫描光程为4 mm。
除样品本身外,近红外光谱的基线漂移和光谱重复性还受光散射、杂散光及仪器响应等因素的影响,因此有必要对原始光谱进行预处理。在常用的预处理方法中,一级微分处理可明显消除光谱的基线漂移,二级微分处理可消除光谱的旋转误差;归一化处理可消除光程的变化;平滑处理可消除光谱仪包含的随机误差,从而提高信噪比;标准正态变换可消除固体颗粒大小、表面散射及光程变化对近红外漫反射光谱的影响;多元散射的作用与标准正态变换相同,主要消除颗粒不均匀及颗粒大小产生的散射影响。本团队[12][14][15][16]已归纳总结出油茶籽粕中茶皂素、水分、灰分模型的最佳预处理方法——将归一化、一阶导数和9点平滑相结合的处理方法;蛋白质模型的最佳预处理方法为将多元散射校正、一阶导数和9点平滑相结合的处理方法;含油量模型的最佳预处理方法为将归一化、二阶导数和9点平滑相结合的处理方法。
定量校正(也称多元校正)是化学计量学的一个主要分支,在分析仪器响应值与物质浓度(或其他物化性质)之间建立定量关联关系。常用的多元校正法包括线性校正法和非线性校正法。其中,线性校正法包括多元线性回归法、主成分回归法和偏最小二乘法;非线性校正法包括局部权重回归和人工神经网络法。对油茶籽粕主要采用偏最小二乘法[14,24][14,24]。
采集的样品光谱经预处理后,一般利用偏最小二乘法建立定量分析模型。为进一步评价模型的预测准确性和可靠性,可将相关系数、均方根误差和相对误差等作为统计参数[15]。表1列出了本团队已建立的油茶籽粕中茶皂素、蛋白质、水分和含油量定量分析模型的定标和验证结果。可以看出,无论是定标集还是验证集,测得的真实值和定标模型预测值之间的相关系数都在0.92以上,说明该模型具有良好的线性相关性;定标集和验证集之间的相对分析误差较为接近,且均大于3,说明所建立的分析模型不仅具有较好的稳定性,还具有较高的预测精度。
指标 |
项目 | 范围/% | 标准差/% | 相关系数/% | 相对分析误差/% |
茶皂素 |
定标集 | 11.4~30.3 | 1.97 | 0.970 | 3.64 |
验证集 | 12.6~25.1 | 1.77 | 0.949 | 3.11 | |
蛋白质 |
定标集 | 1.99~18.8 | 1.83 | 0.970 | 3.32 |
验证集 | 12.4~23.2 | 1.87 | 0.927 | 3.51 | |
水分 |
定标集 | 6.41~12.3 | 1.82 | 0.932 | 3.35 |
验证集 | 8.07~9.11 | 1.69 | 0.921 | 3.44 | |
含油量 |
定标集 | 0.460~9.28 | 1.67 | 0.981 | 3.35 |
验证集 | 0.700~4.09 | 1.63 | 0.970 | 3.08 |
为进一步验证模型,团队成员杨伟根[15]选取20个新样品对已建立的定量分析模型进行外部验证,对各指标进行近红外模型预测,并对近红外法和常规分析方法结果进行成对结果t检验。得到的t值分别为1.07、1.21、1.89、1.56,小于临界值t(0.05,20)=2.09,说明两种方法不存在显著差异,结果一致性较好。另外,耿响等[12]在近红外光谱技术的基础上建立了油茶籽粕中灰分含量快速检测方法,并得到了与国标方法测定结果不存在显著差异的结果。该系列研究为油茶籽粕中茶皂素、蛋白质、水分、含油量和灰分的快速测定提供了方法和技术基础。
现有研究已证实近红外光谱技术在油茶籽粕领域应用的可操作性,但依然存在以下几个需要进一步研究的问题:(1)用于建模的样品量虽然较大,但来源不够广泛,未涉及到全国范围内的样品,应扩充样品来源和样品检测范围来优化模型;(2)在研究中仅选择了样品扫描次数、装填厚度等实验参数,未进一步研究样品粒度、颜色等;(3)现有模型局限于实验室离线检测,未能实现企业在线生产分析,且受台间差等问题影响,未能得到进一步推广。
除了茶皂素、蛋白质、水分、含油量及灰分等已建立近红外分析模型之外,油茶籽粕中的营养因子粗纤维和功能活性成分多糖等还未开发快速方法。作为一种潜在的饲料原料,油茶籽粕中粗纤维含量的大小影响饲料的适口性和消化率,进而影响其饲用价值[25];且可作为蛋白质饲料的一项重要技术要求[26]。油茶籽粕中的多糖具有体外抗氧化性、体内抗肿瘤活性等作用,能够改善肠道代谢、提高肠道菌群多样性[27][28][29]。将近红外光谱技术用于油茶籽粕粗纤维和多糖的研究鲜有报道,已有关于饲料中粗纤维[30]和高粱中粗纤维[31]的近红外光谱快速分析研究。此外,还有关于灵芝多糖[32]、杏鲍菇多糖[33]、猪苓多糖[34]和甘薯多糖[35]的近红外光谱定量分析模型的研究。诸多研究为今后建立油茶籽粕中粗纤维和多糖等近红外分析模型提供了理论依据和技术基础。
经过半个多世纪的发展,近红外光谱技术已被广泛应用于农业、食品、石化和制药等领域,并在工农业生产和商业贸易中发挥着越来越重要的作用。近红外光谱技术标准的发展代表了大众对该技术的认可。Yang Z L等[36]对近红外光谱标准进行了综述,检索到关于近红外光谱的47个国际标准和79个国内标准。相较于欧美发达国家,我国近红外光谱技术标准的研究与制定起步较晚但发展迅速,这与该技术的应用及发展趋势相一致。为了促进近红外光谱技术在油茶籽粕快速检测领域的应用,应加强该技术在油茶籽粕检测中的标准制定工作。
同品牌、不同型号的近红外仪器之间存在差异性,导致耗费大量人力物力建立的分析模型无法直接应用到另外一台仪器上。实现模型共享可大大提高模型的利用率,促进近红外方法的推广使用。台间差是限制近红外分析技术推广的关键瓶颈,模型转移是否成功直接影响到近红外光谱技术的推广应用[37]。
模型转移也称模型传递或仪器/光谱标准化等。通常主机为已建立模型的仪器,子机为待转移的仪器[38]。模型转移通过主机和子机检测信号之间的联系拟合出相应的转移函数,以确保多台仪器的准确性和一致性[39]。模型转移的问题可分为两类:第一类是相同样品在不同测试条件下的不适配问题,第二类是不同样品间产生的不适配问题。解决第一类问题可以保证同源样品的稳定性和准确性,解决第二类问题则能够实现模型在不同样品间的匹配应用和自动传递[40]。
模型转移的算法主要有两大类:有标样算法和无标样算法[41]。有标样模型转移算法包括基于神经网络、因子分析、多元校正多任务学习的模型转移算法。该算法是指根据标准样品在主机和子机上采集的光谱来建立光谱、预测值或模型参数之间的函数关系,进而实现预测结果校正的计算方法。无标样算法则不需要任何标准样品:按照校正对象的不同,可分为无标样光谱校正、无标样模型参数校正和稳健模型建立[38]。
模型转移效果的评价采用校正集决定系数(R
近红外光谱仪器的台间差问题限制了其推广,而模型转移技术则可较好地解决该问题。高云等[44]采用Shenk′s算法将主仪器上建立的模型成功转移到从仪器上,且证明转移后预测结果的平均绝对误差比未转移前小[40]。丁柯等[43]采用直接校正、分段直接校正和光谱差值转移法进行三台不同类型的近红外光谱仪之间的模型转移研究,进一步证明了模型转移的重要性。李雪园等[44]则提出一种基于变量投影重要性系数(Variable Importance in the Projection,VIP)的改进叠加偏最小二乘(improved Stacked Partial Least Square,SPLS)算法与常用的直接标准化(Direct Standardization,DS)模型转移方法相结合的近红外光谱模型转移方法(VIP-SPLS-DS)。结果表明,模型转移后能更精确地预测样品。杨增玲等[45]采用样品扩充和模型校正两种不同方法,实现了实验室模型向饲料生产企业转移的在线应用。王红英等[46]通过基于光谱共享法的模型转移技术,成功建立了离线和在线检测都适用的光谱共享模型。近红外光谱模型转移技术已经得到蓬勃发展,但在转移算法方面依然存在样品需求量大、转移参数多、模型不稳健、计算较复杂等[38]不少问题。
目前已建立的近红外油茶籽粕分析模型还停留在实验室层面。将已建立好的模型通过模型转移来实现模型离线检测和在线检测之间的共享以及不同仪器间模型的共享,是今后近红外光谱技术在油茶籽粕检测中研究的趋势之一。
油茶籽粕具有较高的加工利用价值,可作为饲料、化工、轻工等领域的原料,也可作为新型食品原料,在特医食品、保健食品的研发和应用中具有一定的潜力[47]。根据成分的不同,油茶籽粕可应用到多个领域,其快速检测也将备受关注。本文介绍了近红外光谱技术的基本原理与建模过程,并着重介绍了该技术在油茶籽粕检测中的发展前景。近红外光谱技术在油茶籽粕检测中必将发挥越来越重要的作用。以下几个方面可能是以后研究的关注点:(1)油茶籽粕中粗纤维和多糖分析模型的建立;(2)油茶籽粕质量检测相关标准的制定;(3)将分析模型通过模型转移技术实现模型共享,达到模型的普适性。