• 353.16 KB
  • 2022-06-16 12:43:01 发布

基于可见-近红外光谱技术的蜜源快速识别方法.pdf

  • 5页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
第26卷第3期2382010年3月农业工程学报TransactionsoftheCSAEVbl.26No.3Mar.2010基于可见一近红外光谱技术的蜜源快速识别方法杨燕1,一,聂鹏程1,一,杨海清1,.,何勇隙(1.浙江大学生物系统工程与食品科学学院,杭州310029;2.广西师范大学数学科学学院,南宁530023;3.南昌航天航空大学电子信息工程学院,南昌330069;4.浙江工业大学信息工程学院,杭州310029)摘要:蜂蜜蜜源决定了蜂蜜的药用价值。为了实现快速无损识别蜂蜜蜜源,提出了基于可见.近红外光谱技术结合机器学习的方法来实现蜂蜜蜜源的快速无损识别。该研究采集来自4个蜜源共232份蜂蜜样本光谱数据,随机选取其中212个样本用来构建分类器,剩余20个样本进行分类器泛化学习能力的检验评估。光谱数据预处理采用基线校正,数据标准化和平滑消除干扰和噪声。基于一对多分类规则,采用主成分分析结合贝叶斯线性判别构造线性多分类器,并就分类效果和泛化学习能力与前向神经网络器构成的非线性分类器进行比较。结果表明:基于主成分分析结合贝叶斯线性判别构造的多分类器分类正确率为91.95%,前向神经网络的分类正确率为100%。该研究也表明应用可见.近红外技术对蜂蜜蜜源进行快速分类是可行的。关键词:近红外光谱,模式识别,主成分分析,贝叶斯线性判别,蜜源.doi:10.3969/j.issn.1002—6819.2010.03.040中图分类号:043,TP3文献标识码:A文章编号:1002—6819(2010)一03—0238-05杨燕,聂鹏程,杨海清,等.基于可见一近红外光谱技术的蜜源快速识别方法[J].农业工程学报,2010,26(3):238--242.YangYah,NiePengcheng,YangHaiqing,eta1.Rapidrecognitionmethodofnectarplantbasedonvisible-nearinfraredspectroscopy[J】.TransactionsoftheCSAE,2010,26(3):238--242.(inChinese、jlritllEnglishabstract)0引言蜂蜜被誉为“百花之精”,其富含糖类物质(包括单糖、不同单双糖、低聚糖和多糖)、多种维生素、蛋白质、氨基酸、脂肪酸及多种人体必需的微量元素。蜜源来源植物是进行蜂蜜种类划分的一个重要依据,不同蜜源的蜂蜜,不仅在感官和内在品质上存在一定的差异,而且其营养价值也有所不同。然而,由于蜂蜜感官特征易受加工、贮存、结晶等因素影响,传统方法难以准确辨别蜂蜜品种,容易造成蜂蜜市场品种标志混淆、价格混乱。因此,有必要开展蜂蜜蜜源品种鉴定研究,以保护消费者利益,保证蜂业健康发展。传统方法利用感官分析、花粉分析要求熟练掌握不同蜂蜜的知识,方法的准确度和精确度易受蜂蜜中花粉含量、种类组成、蜂蜜来源、产地、蜜源植物花粉形态、蜜蜂采蜜方式、蜂蜜收集、放蜂环境等因素影响【l】。利用理化分析结合化学计量学可对单花蜂蜜的不同质量参数(水分、pH值、糖、电导率、酸度、脯氨酸、酶值等)收稿日期:2009-06—12修订日期:2009-08-24基金项目:国家高技术研究发展计划(“863”计划)项目(2006AAl02234);公益性行业(农业)科研专项(200803037)作者简介:杨燕(1973一),女,广西南宁人,博士,主要从事农业信息自动处理与识别研究。杭州浙江大学生物系统工程与食品科学学院,310029。Emaihy_yae@yahoo.cn※通信作者:何勇(1963一),男,浙江杭州人,教授,博士生导师,主要从事农业电气化及自动化、生物环境工程与能源工程研究。杭州浙江大学生物系统工程与食品科学学院,310029。Email:yh哦iu.ezht.cn进行识别【2‘41;也可用色谱分析法,通过各种萃取方法,如溶剂萃取法、改良的“Likens.Nickerson”蒸汽蒸馏法和溶剂萃取,动态顶空萃取(dynamicheadspaceextraction,DHS),固相微萃取以及气体传感器等【5‘10I,分析单花蜜中的挥发性物质成分。但以上鉴定方法都存在对样品进行破坏性处理,且分析费时、操作复杂等缺陷,同时测试过程中用到强酸或强腐蚀性等有害试剂还需进行高温操作,影响检测人员的安全和健康。因此,有必要探索一种新的快速、廉价、安全无损的测定蜂蜜蜜源的方法。可见.近红外光谱检测技术以其高效、快速、低成本、无污染、非破坏和易于实现在线检测等特点在农业和食品行业得到广泛的重视和应用【l卜15】。应用该检测技术,样品无需处理,无有害试剂,快速且重复性好。本研究通过对4种蜜源蜂蜜的可见.近红外光谱数据进行分析,建立了2种不同分类算法的分类模型,并以分类准确率作为指标评价模型的优劣,以期取得最优分类模型。1材料和方法1.1仪器试材和数据分析软件试验使用美国oceanoptics公司的USB4000光纤光谱仪,光谱采样总像素3648点,测定范围346.01~1038.08nlrl,分辨率0.3nm,积分时间为10gs~65S,光程为1cm。蜂蜜样本购自当地超市,选择4个蜜源品种,分别是椴树、紫云英、洋槐和野菊花,样品密封保存在恒温25℃下。在样品采集光谱前,先将蜂蜜摇匀并置于50℃的水浴中,在使可溶物充分溶解后采集光谱信息。每个品种蜂蜜采集58个样本,每个样本测试3次光 第3期杨燕等:基于可见一近红外光谱技术的蜜源快速识别方法239谱后取平均值,最后得到232个样本光谱曲线。在样本总集中随机取212个样本构成建模集,其余20个样本构成测试集。光谱数据处理及图形绘制分别采用MATLAB7.0和Origin8.0编程实现。1.2光谱预处理光谱预处理可有效消除因系统误差和随机误差而引入到光谱测量数据的噪声,高维光谱数据中夹杂着高频噪声,同时还可能存在各随机因素引起的光谱信号基线漂移和基线旋转。为了从复杂、重叠、变动的背景中提取光谱有用信号,获取高信噪比、低背景干扰的分析信号,研究分别采用了基线校正、平滑和数据标准化等预处理方法对所得到的光谱数据进行必要的预处理。1.3样品近红外图谱分析经预处理后的样品可见.近红外图谱信息如图1所示。图中横坐标为光谱波长,纵坐标为吸收率值,4条谱线代表4种蜜源信息的平均谱线信息。从图l中可以看到,整个图谱的整体趋势一致,但是在409~492nm、553~653nnl以及930~l014nm波段样品谱线存在梯度差异。这可能是由于蜜源不同,其来自蜜源的挥发性物质的组成成分不同引起的,梯度差异为定性分析提供了可能。300400500600700800900looo11∞波长/m图1样本可见逝红外光谱图Fig.1Visible-nearinfi"aredreflectancespectraofthesamples1.4分类模型1.4.1主成分分析.贝叶斯分类主成分分析(principalcomponentanalysis,PCA)是一种对多维数据采用组合特征方法实现降维的算法,利用线性组合的方法把高维数据投影到低维空间,寻找在最小均方意义下最能代表原始数据的投影方法ll6|。贝叶斯分类则是利用概率的不同分类决策与相应的决策代价之间的定量折中实现分类问题。首先主成分分析将高维光谱数据进行压缩降维,构成分类所需的特征向量,其次将特征向量输入分类器实现分类。对于两分类问题,通过对特征向量的观测将先验概率转换为后验概率,根据后验概率大小进行类别判断。设观测特征向量为X,类别为∞,(,_l,2),贝叶斯公式可表示为粥㈨=掣㈤式中p(xH正据因子,它仅仅是一标量,故贝叶斯判决规则可表述为p(xIq)P(q)>p(xt02)P(c02)(2)判别为C01,否则判别为∞2。对于多分类问题,可构造多个判别函数受∽蜀(x)=形x+nk(3)式中:彬——特征值x对应的权向量;∞o广阈值权,对所有的,≠i,有蜀(功>g,(x)(4)则分类器将此特征向量x判为03;。1.4.2主成分分析.BP神经网络分类首先主成分分析将光谱数据进行压缩,从而构成相应的可以表征原始信息的特征向量,然后将特征向昔作为BP神经网络(backpropagationneuralnetworks,误差反向传播神经网络)的输入构造分类器。BP神经网络是一种单向传播的多层前向网络,可以适应复杂模型非常灵活的启发式统计模式识别。与线性判别分析相比,神经网络分类器可以获得任意的判决边界而并不一定是线性的,通过启发式技巧,改进其网络性能,提高其训练速度。对问题非正式或启发式的知识,神经网络分类器可以通过对隐含层的数目、节点单元个数和反馈节点数目的选择实现优化。2结果与分析利用PCA算法对预处理后的光谱数据进行压缩处理,主成分数的确定以线性分类器的分类正确率为评判指标。图2是光谱数据经PCA处理后样本在主成分1—3的3个投影方向的得分图。从图2中可以看出,4个蜜源品种之间只有野菊花蜜可以明显被区分,而其他3个蜜源存在严重的重叠现象,说明仅靠3个主成分得分所构成的特征向量不足以达到良好的分类效果,必须增加更多的信息,体现为增加主成分数的个数,这和图3的结论是相符的。图3是分类正确率随主成分数增加的变化趋势。★紫云英O野菊花。洋槐口椴耐注:PCI——主成分1投影方向,PQ——主成分2投影方向,PC3——主成分3投影方向图2样品前3个主成分得分图Fig.2Scoresofthefirst3primarycomponentsofsamples¨旺o;|舭舶静馨群 农业工程学报2010笠芝.8l}露目j日c隶O1020304050主成分数图3分类正确率随主成分数变化趋势图Fig.3Changetrendofclassificationaccuracyratewiththenumberofprincipalcomponents从图3可以看出,随着主成分数的增加,可用于分类的信息增多,从而使分类器的分类正确率随之增加。主成分数在达到10以后分类器的分类正确率增长缓慢。从PCA分析中可看到,随着主成分数的增加,其对原始数据的信息表示量的贡献愈来愈小,虽然主成分数的增加可以提高分类正确率,但同时也增加了分界面函数的复杂度,在综合考虑二者之间的平衡后,本研究取主成分数为lO来构造分类器。从表1可看到,主成分数达到10的时候已经能代表原始数据98.96%的信息量(即前10个得分值的累加)足以反映原始数据的主要特征。表1主成分数与得分值TablelNumberofprincipalcomponentsandscorevalues主成分数得分值主成分数得分值l88.36760.08428.15270.07031.41680.06340.45990.05750.23410O.056本研究取主成分数为10构造贝叶斯线性分类器,分类数为4,共构造了6个线性分类超界面。其中a类代表蜜源紫云英,b类代表蜜源野菊花,c类代表蜜源洋槐,d类代表蜜源椴树,通过构造出来的线性分类器对预测集进行预测分类。结合建模集和校验集,线性分类器模型的整体分类正确率为91.95%,错分率为9.05%。表2为校验样品集的后验概率。神经网络构造的分类器对预测集样本的预测结果如表3所示。利用PCA对于预处理后的光谱数据进行降维压缩后,抽取样本主成分信息,取8个主成分数建立3层的BP神经网络模型以达到分类目的。各层传递函数采用S型(Sigmoid)函数。经反复训练,网络输入层节点数为8,确定隐含层节点数为16,输出层节点数为2。目标误差设为0.0001,训练迭代终止次数为100次。采用此方法构造的分类器模型对预测集进行预测,其预测分类正确率为100%。表2校验集样品后验概率Table2Posteriorprobabilityofcalibrationofthesamples注:校验集样品序号l一5属于紫云英;6一lO属于野菊花;II-15属于洋槐;16—20属于椴树。表3BP神经网络模型预测结果Table3Predictionresultsofthe20samplesbybackpropagationneuralnetworksmodel注:预测样本序号l一5属于紫云英;6一lO属于野菊花;1l—15属于洋槐;16—20属于椴树。∞够∞船∞饴伯 第3期杨燕等:基于可见一近红外光谱技术的蜜源快速识别方法2413结论本文通过对4种蜜源蜂蜜的可见.近红外光谱,结合数据压缩和模式识别方法对蜜源进行定性分析研究。采用统一的数据预处理方法后,比较了2种分类模型的分类效果,其中基于主成分分析的线性分类器分类准确率为91.95%,而基于主成分分析的神经网络分类器分类准确率为100%。通过分析表明,在PCA主成分分析的基础上,随着特征向量维数的提高,将使得特征向量可以携带更多有利于分类的样品信息,线性分类器的性能也会随着特征向量维数的提高得到改善,但同时也增加分类函数的复杂度,使分类器构造复杂,降低分类速度。而构造非线性分类器BP神经网络在特征向量维数较低的情况下,可以极大地提高分类器的分类正确率。研究结果表明:1)能够利用机器学习的方法结合可见.近红外光谱技术实现蜜源的定性分析,为蜜源的鉴别提供一种快速、无损的新手段。2)成功鉴别蜜源需要合适的数据处理和分类方法,通过BP神经网络构造的分类器在复杂性和有效性方面得到了有效统一,研究证明了该方法是可行的。3)在应用BP.ANN模型时,隐含层的节点数存在优化的必要。研究模型的可靠性和动态适应性将是以后推广基于光谱技术进行蜜源判别应用的关键。【l】【2】【3】【4】【5】[6】[参考文献]史琦云,炱建民.蜂蜜品质的花粉检验法研究叨.中国养蜂,2005,56(2):9—11.ShiQiyun,YuanJianmin.Astudyonthemethodoftestingpolleninhoney[J].ApieultureofChina,2005,56(2):9--11.(inChinese谢thEnglishabstract)CordeliaC,MilitaoJSLT,ClementMC,eta1.HoneycharacterizationandadulterationdetectionbypatternrecognitionappliedonHPAEC—PADprofiles.1.Honeyfloralspeciescharacterization[jJ】.JournalofAgriculturalandFoodChemistry,2003,51(11):3234--3242.DevillersJ,MorlotM,PhamDMH,eta1.Classificationofmonofloralhoneysbasedontheirqualitycontroldata[J].FoodChemistry,2004,86(2):305--312.Mateo&Bosch—ReigF.SugarprofilesofSpanishunifloralhoneys[J].FoodChemistry,1997,60(1):33—41.D’artyB心RintoulGB,RowlandCY,eta1.CompositionofAustralianhoneyextractives.1.nonsoprenoids,monoterpenes,andothernaturalvolatilesfrombluegum(Eucalyptusleucoxylon)andyellowbox(Eucalyptusmelliodora)honeys[.J].JournalofAgriculturalandFoodChemistry,1997,45(5):l834—1843.Bouseta九CollinS.OptimizedLikens.Nickersonmethodologyforquantifyinghoneyflavours[J】.JournalofAgriculturalandFoodChemistry,1995,43(7):1890一1896.RadovicBS,CareriM,Mangia八eta1.ContributionofdynamicheadspaceGC—MSanalysisofaronlacompoundstoauthenticitytestingofhoney[J].FoodChemistry,2001,72(4):511--520.【8】PerezR八Sanchez-BrunetteC,CalvoRM,eta1.AnalysisofvolatilesfromSpanishhoneysbysolid-phasemicroextractionandgaschromatography-massspectrometry[J】.JournalofAgriculturalandFoodChemistry,2002,50(9):2633--2637.【9】BenedettiS,ManninoS,SabatiniAG,cta1.Electronicnoseandneuralnetwork啪fortheclassificationofhoney[J].Apidologie,2004,35(4):1—6.【10】BianchiF,CaredM,MusciM.Volatilenorisoprenoidsasmarkersofbotanicalongi丑ofSardmianstrawberry-tree似rbutusunedoL.)honey:Charactedsationofaromacompoundsbydynamicheadspaceextractionandgaschromatography·nlassspectrometry[J].FoodChemistry,2005,89(4):527--532.【11】裘正军,陆江锋,毛静渊,等.基于可见.近红外光谱的可乐品牌鉴别方法研究[J】.光谱学与光谱分析,2007,27(8):1543—1546.QiuZhengjun,LuJiangfeng,MaoJingyuan,eta1.Discriminationofvarietiesofcolausingvisual·nearinfraredspectra[J].Spectroscopyandspectralanalysis,2007,27(8):1543—1546.rinChinese丽thEnglishabstract)[12】ShaoVongni,HeYong,WuChangqing.Dosedetectionofradiatedricebyinfraredspectroscopyandchemometrics[J].JournalofAgriculturalandFoodChemistry,2008,56(11):3960--3965.【13】王多加,周向阳,金同铭,等.近红外光谱检测技术在农业和食品分析上的应用叨.光谱学与光谱分析,2004,24(4):447--450.WangDuojia,ZbouXiangyang,JinT0ngmi,eta1.Applicationofnear-infraredspectroscopytoagricultureandfoodanalysis[J].SpectroscopyandSpectralAnalysis,2004,24(4):447--450。(inChinese谢也Englishabstract)【14】何勇,李晓丽,邵咏妮.基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究阴.光谱学与光谱分析,2006,26(5):850--853.HeYong,LiXiaoli,ShaoYongni.Discriminationofvarietiesofappleusingnearinfraredspectrabasedonprincipalcomponentanalysisandartificialneuralnetworkmode[J].SpectroscopyandSpectralAnalysis,2006,26(5):850--853.(inChinesewithEnglishabstract)【15】吴迪,何勇,冯水娟,等.基于LS.SVM的红外光谱技术在奶粉脂肪含量无损检测中的应用【J】.红外与毫米波学报,2008,27(3):180—184.WuDi,HeYong,FengShuijuan,eta1.ApplicationofinfraredspectratechniquebasedonLS-supportvectormachinestothenon-destructivemeasurementoffatcontentinmilkpowder[J].JournalofI.nfi"aredandMillimeterWaves,2008,27(3):180—184.(inChinesewithEnglishabstract)【16】RichardODuda,PeterEHart,DavidGStork.模式识别[M】.李宏东,等译.北京:机械工业出版社,2003. 242农业工程学报2010矩Rapidrecognitionmethodofnectarplantbasedonvisible—near●n■·inlrarenspectroscoDyYang"Canl,一,NiePengchen91,一,"wangHaiqin91”,HeYon91※(1.CollegeofBiosystemsEngineeringandFoodScience,Zhej缸ngUniversity,Hangzhou310029。China;2.CollegeofMathematicsScience,Guang"xiTeacherUniversity,Nanning530023,China;3.SchoolofElectronicandInformationEngineering,NanchangHangkongUniversity,Nanchang330069,China;4.CollegeoflnformationEngineering,ZhejiangUniversityofTechnology,Hangzhou310032,China)Abstract:ThehoneyiSworthofnectarplant.Arapidnon-destructivemethodofpatternclassificationfornectarplantWasdevelopedbasedonvisible-nearinfraredspectroscopyinthisstudy.111enectarplantscamefromfourcategorieswhichwereTilia,Astragalus,LeguminosaeandWildhrysanthemum,respectively.Atotalof232samplesfromfourdifferentnectarplantswerestudied.Thecalibrationsetwasconsistedof212samplesandthepredictsetconsistedof20samples.TheclassifierWasconstructedbycalibrationsetwhichwasselectedrandomlywhilepredictionsetwasusedforevaluatingthestudyabilityofclassifier.Thepreprocessingmethodswerecarriedonthespectrumdata.suchasbaselinecorrection,normalizationandsmoothing.111epreprocessingmethodsCallenhancesignaltonoiseratioandremovetherandomerror.ThetwoclassifiermodelsweredevelopedusingpricipalcomponentanalysiscombinedwithBayesianlinediscriminantanalysisbasedonone-two-manyrulemethodandbackpropagationatificialnervenetmethod.TheaccuracyofpricipalcomponentanalysiscombinedwithBayesianlinediscriminantanalysismodelwas91.95%andthatoftheBP—atificialnervenetmodelWas100%.111eresultsindicatedthatthenectarplantwouldbequicklydetectedbyVis二Nmspectroscopytechnique.anditisveryfeasible.Keywords:nearinfraredspectroscopy,patternrecognition,principalcomponentanalysis,Bayesianlineardiscriminant,nectar