随着食品产业规模的扩张及食品供应链的发展,食品掺假对全球经济的正常运行、消费者的健康和权益都带来了巨大的影响。目前,以经济利益为驱动的食品掺杂(economically motivated adulteration,EMA)正成为一个全球性话题。随着现代食品工业技术的迅猛发展,掺假手段已从早期的稀释勾兑、缺斤少两等简单手段向利用现代食品科学技术进行“去真存伪”等形式发展[1]。目前食品的主要掺假手段包括:假冒物种及品种、冒充或虚标原产地、原料品质以次充好、掺入杂劣质及违禁原料等。此外,食品基质除了本身具有复杂性的特点外,还因其产业发展迅速、种类繁多、检测技术手段相对滞后,导致掺假隐蔽,难以检测,真实属性识别往往“无从入手”。因此亟须具有可预测性和非目标性的检测技术对食品的真实属性进行有效鉴定。
代谢组学由英国伦敦大学帝国学院的Nicholson教授等[2]在1999年首次提出,它与基因组学、蛋白质组学、转录组学共同构成了“系统生物学”。代谢组学是位于基因组学、转录组学和蛋白质组学下游研究生物系统的一种新兴组学。Fiehn等[3]于2000年提出代谢组学的另一种表述——metabolomics,指出代谢组学是对生物体内所有代谢产物的定性定量分析。代谢组学在疾病研究、药物开发及毒性评价、微生物代谢组学、植物育种和作物质量评估、毒理学、环境科学等研究领域都有所应用[4-7]。代谢组学在食品科学领域起步较晚,Wishart等[8]于2008年对应用于食品科学相关领域的代谢组学研究进行了综述,阐述了代谢组学在食品科学领域的含义。此后Cubero-Leon等[9]对蜂蜜、食用油、饮料、肉类等基于代谢组学的食品鉴伪研究进行了综述,提出该领域代谢组学是基于分析生物体系内所有小分子代谢产物(相对分子质量小于1 000),通过高通量、高灵敏度和高分辨率的现代仪器,结合模式识别等化学计量学方法分析生物体内代谢产物变化规律的一种新兴研究工具。它对非特定目标物的检测有着其他方法无法比拟的优势,因而能对掺假食品加以科学地区分和鉴别[4]。本文针对代谢组学在食品物种及品种鉴别、产地溯源、品质分级和掺假掺杂的识别等真实属性鉴别领域的应用进行了综述,旨在为食品真伪鉴别提供参考和借鉴。
根据研究方法、目的和对象等可将代谢组学进行不同的分类(见图 1)。Fiehn等[3]根据代谢组学的研究方法,将其划分为4个层次:一是代谢物靶标分析,对一个或几个特定组分进行分析;二是代谢轮廓分析,针对预设的少量代谢产物进行定量分析;三是代谢物组学分析,针对特定条件下样品中的所有代谢产物进行定性和定量研究;四是代谢物指纹分析,无需分离鉴定样品的具体组分,只进行快速识别分类或判别分析。另外,代谢组学根据研究目标可分为3类[10]:一是信息型,对代谢物进行定性定量以获取信息;二是判别型,用于寻找不同样本间的差异;三是预测型,建立数据模型,用于对未知样品进行识别验证。代谢组学按研究对象的不同分为非靶标代谢组学分析和靶标代谢组学分析两种[10]。非靶标代谢组学是通过分析尽量多的代谢物、寻找具有统计学意义的特征标记物来反映生物状态的一种研究方法;靶标代谢组学则是预先提出假设,对样品进行选择性提取,去除无关代谢物的干扰,针对特定的标记物进行研究并验证假设的一种研究方法。
代谢组学所研究的代谢物位于生理、生化活动调控的末端,更能够反映生物体变化规律的整体性,与其他组学技术,如基因组学、转录组学以及蛋白质组学相比,有如下优势:(1)基因和蛋白质表达的微量变化会引起代谢产物水平的明显变化,代谢组学分析更能揭示生物体的生理生化状态;(2)无需对全基因组测序和建立庞大的表达序列数据库;(3)代谢物在各个生物体中种类相似,且数目远远小于基因和蛋白质的数目,有利于建立代谢物的数据库和进一步研究分析[4]。
代谢组学的研究流程包含实验设计、样品采集、预处理、检测、数据处理和分析6个基本步骤(见图 2)。对于不同的研究领域,研究流程的侧重点有所差异,样品采集、检测和数据处理是食品真实性鉴别研究的关键流程[11]。样品采集的多样性和真实性对结果的准确性和数据的代表性起着决定作用,样品的检测保证了数据的有效性和全面性,数据处理的效果决定了判别模型的预测能力和拟合能力,这些共同决定了对食品真实属性鉴定研究的结果[11]。
代谢组学是基于食品中所有代谢产物的整体分析方法,需要高通量、高灵敏度、高分辨率的实验仪器来满足其检测要求。一般根据生物样品的性质、提取的手段等条件选择合适的分析技术。代谢组学常用的检测技术包括振动光谱技术、色谱-质谱联用技术、核磁共振技术等。振动光谱技术是一种非入侵性快速无损的指纹图谱分析技术,近几年已被广泛应用于食用油的掺假、茶叶的产地溯源及品质监控、蜂蜜蜜源鉴定等食品的真实属性快速鉴别中[12]。该技术易受到水分的影响且不能鉴定特征标记物,较适合水分含量低的食品的模糊鉴别[12, 13]。色谱-质谱联用技术结合了色谱强大的分离能力,根据精度和分辨率选择合适的质谱,尽可能多地对复杂样品中代谢产物种类进行精准分析,提供相对分子质量和结构信息[14]。GC-MS技术用于精油、烃类和酯类等挥发性物质的检测,能检测到痕量(10-11~10-13mg/L)的代谢产物,且拥有有利于特征标记物鉴定的全面数据库,适合橄榄油、绿茶等食品的鉴别[11]。LC-MS技术有着对样品挥发性和检测温度要求低、前处理方便等优势,适合于果汁、葡萄酒和功能食品(贝母、冬虫夏草)中特征代谢产物的鉴定及真实属性鉴定。但LC-MS技术尚没有一个全面的数据库,这加大了图谱分析的难度[11]。核磁共振(nuclear magnetic resonance,NMR)是基于原子核磁性、可用于快速无损分析检测样品的一种技术,其中的1H-NMR是代谢组学主要的分析技术[15]。核磁共振虽灵敏度不如其他技术高,但能够有效区分同分异构体,确定代谢物结构式。有学者通过1H-NMR技术鉴定大枣、咖啡和藏红花等食品中的代谢产物来有效评估其真实属性。这些技术的不断发展和完善都为代谢组学的研究提供了很好的分析研究平台[16]。
样品经分析检测后得到的是多维的数据信息,对于复杂而庞大的多维数据进行处理、分析和管理需要结合化学计量学工具进行处理。化学计量学分为数据预处理和数据分析两个步骤。数据预处理主要包括对原始数据进行提取、峰对齐、去噪、比对、标度和归一化等处理[17]。数据分析包括非监督分析和有监督分析两种。无监督分析能够在未知样品信息的情况下将样品进行聚类分组,包括多变量数据分析(multivariate data analysis,MADA)、主成分分析(principal components analysis,PCA)、聚类分析(hierarchical cluster analysis,HCA)等[15]。无监督分析方法不能忽略组内误差,且太关注细节,忽视整体性规律,不适合组间差异的鉴别和差异化合物的筛选[18]。有监督分析方法能够减少组内随机误差,突出组间系统误差,弥补无监督模型的缺陷[18]。主要包括偏最小二乘法-判别分析(partial least squares-discriminant analysis,PLS-DA)、正交偏最小二乘法-判别分析(orthogonal signal correction partial least squares-discriminant analysis,OPLS-DA)和支持向量机分析(support vector machine,SVM)等[19]。此外,有监督分析方法的优势还在于能通过模型验证避免分类结果的过度乐观,通常通过参数R2(拟合率)和Q2(预测率)来评价模型,数值接近1表明预测模型的有效性高,且能准确预测未知样品。这些都为寻找样品之间或各组之间的差异、确定标记代谢产物、建立鉴定方法提供了很大帮助。
代谢组学自出现以来得到了较快发展,被广泛应用于各个研究领域,包括疾病研究、药物开发及毒性评价、植物育种和作物质量评估、微生物代谢、食品、毒理、环境等研究领域[4-7]。在食品真伪鉴别领域,代谢组学在物种及品种鉴定、产地鉴定、品质鉴别、掺假掺杂鉴定等方面应用广泛(见表 1)[9]。目前,代谢组学技术虽然处于发展阶段,但在食品质量安全检测中体现了其他检测手段无法比拟的优势,对食品真实属性鉴别等方面的研究具有重要意义。
不同物种和品种制成的食品功效及价格往往有显著差异。由于不同物种价格差异大、外观口感差异小、传统鉴伪方法难以鉴别,导致掺假现象层出不穷。在物种和品种的鉴别中使用的化学计量学方法有所不同。无监督的PCA从整体角度出发,最大程度保留了数据的原始状态,适合组内差异较小的品种区分及异常样品的鉴别[18]。而监督型模型则适合于组间差异较大的物种的鉴别。Yang等[20]使用GC-MS技术分析橄榄油、玉米油、花生油、菜籽油和葵花籽油中22种脂肪酸和6种重要参数,使用PLS-DA模型能够检测出含有1%其他油的橄榄油,预测能力达到90%。液相色谱-质谱联用技术为液体食品及固体药食两用食品提供了一种高通量、高灵敏度的快速鉴别手段,结合化学计量学方法可快速有效鉴定不同物种或品种制成的产品。Jandric等[21]使用LC-QTOF-MS技术结合三维主成分分析(three-dimensional principal components analysis,PCA-3D)和S-Plot模型解决了凤梨汁、橙汁、葡萄柚汁、苹果汁、柑橘汁和柚汁相互掺杂的问题,该检测方法灵敏度高,检出限达到1%。他们还使用非靶标代谢组学分析得到橙皮苷、苯基丙氨酸等21种特征标记物用于鉴别果汁的物种类型。Li等[22]和Jandric等[47]基于代谢组学技术,采用LC-QTOF-MS技术结合PCA分析对贝母、蜂蜜等保健食品的品种鉴别建立了检测方法。此外,也有学者用GC-MS技术和1H-NMR技术解决食品的品种鉴别问题。Farag等[24]基于代谢组学技术,用LC-QTOF-MS和GC-MS结合PCA分析建立了黑种草子的品种鉴别方法,发现山柰酚糖苷结合物是区分6种不同品种黑种草子的特征标记物。Fotakis等[25]利用代谢组学技术实现了对不同种类烈酒的鉴别,采用1H-NMR技术结合PCA分析可有效区分传统的齐普罗酒和白兰地酒。Zotti等[26]使用1H-NMR技术结合PCA和PLS-DA模型分析了意大利蓝蟹、疣酋妇蟹和黄道蟹,研究发现单不饱和脂肪酸信号区可以有效区分这3种蟹,意大利蓝蟹有更高含量的谷氨酸、丙氨酸和甘氨酸,而疣酋妇蟹和黄道蟹的龙虾碱、乳酸、甜菜碱和牛磺酸含量更高。
地理标志产品的市场价值(如知名度、质量、附加值、安全性)远高于其他同类产品,不同产地的食品功效往往也有差异。同时,一些传统的药食两用的食品具有地域文化的特定意义(如西藏的枸杞、青海的冬虫夏草等)。但随着地理标志产品的增多,假冒标识、以次充好等掺假现象也逐渐增多,极大地损害了市场贸易、品牌维护及消费者的权益[48]。研究表明,代谢组学技术结合化学计量学方法,尤其是监督型模型(PLS、LDA(linear discriminant analysis,线性判别分析)等),可有效减少同一产地食品间的差异,找到地理标志产品的特征,进行有效预测[18]。Vaclavik等[27]基于代谢组学,使用LC-QTOF-MS技术结合化学计量学分析手段建立了葡萄酒的产地鉴别方法,通过PLS-DA模型可有效鉴别来自不同产地的赤霞珠、梅鹿辄、黑皮诺3大类共计51种地理标志葡萄酒,准确率达96%。Bondia-Pons等[28]使用LC-QTOF-MS技术结合PCA和CA(cluster analysis)分析建立了产自中国西藏地区、中国其他地区以及蒙古的枸杞产地鉴别方法。Arana等[29]采用1H-NMR检测了不同产地咖啡中的代谢产物,运用PLS-DA分析实现了对产自阿拉伯、哥伦比亚和其他地区咖啡的有效鉴定,研究发现脂肪酸、醋酸盐及有机酸是区分咖啡产地的3大类特征标记物。Jung等[33]使用1H-NMR技术结合PCA和OPLS-DA模型对产自澳大利亚、韩国、新西兰和美国4个国家的牛肉进行了鉴别。Stanimirova等[30]采用GC-MS技术分析了产自科西嘉的蜂蜜和5种其他产地的蜂蜜,使用LDA、PLS和SVM模型均能有效区分不同产地的蜂蜜。代谢组学结合电子鼻、电子舌技术以及红外光谱技术的研究为产地溯源鉴别提供了快速无损的鉴别方法。Xu等[31]使用电子舌技术结合稳健主成分分析法(ROPCA)和PLS-DA模型鉴别产自西湖、杭州钱塘江、岳州的龙井茶,两种模型的灵敏度/特异性分别达到了1.000/1.000和1.000/0.967。Yan等[32]使用近红外光谱技术结合PLS-DA模型建立了产自安溪和其他地区的乌龙茶的快速无损鉴别方法,并通过标准正态变量变换(standard normal variate,SNV)和红外二阶导数光谱(second-order derivatives,D2)优化模型,使灵敏度和特异性分别达到了0.931和1.000。
食品的品质问题与消费者的健康、权益甚至安全直接相关,某些食品的功效会随着新鲜度等品质的降低而降低,因此对食品进行质量等级和品质鉴定具有重要意义。但影响食品品质的因素极多,采用靶向性的传统检测手段无法有效鉴别,代谢组学技术对食品中代谢产物全面而详细的分析能够有效解决食品品质鉴别问题。Chua等[34]基于代谢组学,使用GC-MS和LC-MS技术结合OPLS-DA模型建立了燕窝品质鉴别方法,该方法能够有效鉴别燕窝的颜色、产地及类别(洞燕或屋燕),且GC-MS对于加工后的燕窝鉴别效果更好。NMR技术提供了代谢产物详细而确切的结构信息,能够有效鉴定出特征代谢产物的结构,通过代谢组学评价食品的品质。Chen等[35]使用1H-NMR技术结合PCA分析研究大枣的成熟度,评价其品质,研究发现未成熟的大枣黄酮含量更高,抗氧化活性更好,cAMP(环磷酸腺苷)含量更高,对神经表达有更好的效果。近年来也有不少将代谢组学应用于有机食品鉴定的研究。Novotná等[36]使用实时直接分析飞行时间质谱(direct analysis in real time of flight mass spectrometry,DART-TOF-MS)技术结合PCA和LDA模型分析了有机和普通栽培得到的40种番茄和24种辣椒,该方法对有机番茄和辣椒鉴别的准确率分别达到了97.5%和100%,预测能力均达到80%,研究表明栽培时间是造成有机食品和普通食品代谢产物差异的关键因素。Ruiz-Samblás等[37]基于代谢组学技术,根据GC-MS指纹图谱得到了特级橄榄油、初榨橄榄油、橄榄油和果渣油这4种不同等级橄榄油的三酰甘油图谱,研究发现1-棕榈酸-2-硬脂酸-3-油酸甘油酯和1,2-油酸甘油酯-3-硬脂酸是用于鉴定橄榄油质量等级的代谢产物。Trocino等[38]使用近红外光谱技术结合PCA和软独立模式分类(soft independent modelling class analogy,SIMCA)模型建立了有机及普通海鲈鱼肉品质的鉴别方法,该方法能有效鉴别新鲜切碎的海鲈鱼的个头大小及饲养情况,也能对冷冻干燥后的海鲈鱼的饲养情况进行鉴定。
食品掺假掺杂等违法行为对消费者的切身利益甚至生命安全造成巨大损害,主要掺假方式包括果蔬汁及饮料中掺入甜味剂和酸味剂、功能食品中掺入违禁化学物质或药物成分等。这些未标识成分不仅种类繁多、难以检测,而且某些劣质原料会对食用者的健康造成不可挽回的影响。传统方法检测目标单一,难以应对种类繁多的掺假物质。代谢组学技术基于全面分析食品中的代谢产物而对非目标添加成分的检测有着巨大优势。Willems等[39]使用毛细管气相色谱-火焰离子化检测技术(capillary gas chromatography with flame ionization detection,CGC-FID)和高效液相色谱-脉冲电流检测技术(high-performance liquid chromatography with pulsed amperometric detection,HPAE-PAD)联用的方法对使用甜味剂和水调配的梨汁进行了鉴定,研究发现这两种技术的联用不仅能通过寡糖指纹图谱鉴定梨汁中掺有的0.5%~5.0%(体积分数)的果葡糖浆、菊粉转化糖浆等4种商业甜味剂,还能通过熊果苷和纤维二糖的含量鉴定苹果汁与梨汁相互掺杂的问题。Du等[30]使用LC-QTOF-MS技术建立了针对掺有糖浆蜂蜜的鉴定方法,该方法能够在30 min内鉴定出掺有10%(体积分数)玉米糖浆、高果糖浆、转化糖浆和大米糖浆的掺假蜂蜜,为蜂蜜的掺杂提供了一种快速检测手段。Sun等[41]使用GC-MS技术结合化学计量学分析法解决了亚麻油的掺假问题,该法通过检测亚麻油中的挥发性成分,筛选其中28种脂肪酸,建立了PLS模型,能够检测出含有10%(体积分数)掺假物的亚麻油,准确度达到95.6%。Zhang等[42]使用LC-QTOF-MS技术结合PCA分析建立了冬虫夏草的鉴伪方法,通过PCA分析及特征标记离子可有效区分冬虫夏草、草石蚕以及虫草花。Petrakis等[43]使用1H-NMR技术解决了藏红花的掺假问题,通过对番红花、大红花、栀子花等常见掺假物中的姜黄素类化合物和糖类化合物等特征化合物的检测有效评估藏红花的真实属性,并运用非靶标代谢组学结合OPLS-DA模型成功预测出含有20%掺假物的藏红花。
代谢组学在食品加工方式、原料属性及来源、功能食品的功效评价鉴别等方面也有所应用。不同加工方式的功能食品的功效及价格都有很大差别。Fraser等[44]使用LC-QTOF-MS技术结合PCA分析建立了茶叶发酵类型的鉴别方法,通过非靶标分析发现酚醛树脂是区分绿茶、乌龙茶和红茶的重要代谢产物。原料的不同部位、生长情况均会影响食品的功效和价格。Zhao等[46]基于代谢组学技术,采用快速流动注射质谱(flow-injection mass spectrometry,FIMS)指纹图谱法对绞股蓝不同部位的食材进行了有效鉴定,该方法通过分析单倍和双倍体绞股蓝的叶子及整株植物,使用PCA和PLS-DA模型,能够在2 min内完成鉴定。代谢组学在保健食品功效评价中也有所应用。Zhang等[42]使用LC-QTOF-MS技术结合PCA分析建立了虫草养殖方式的鉴别手段,并通过非靶标分析鉴定出吡哌酸、肌苷、虫草素等18种用于区分冬虫夏草和人工养殖的代谢产物。产自北美的西洋参药性甘凉,具有滋阴补肾、补气养血的功效,而产自亚洲的高丽人参药性平温,具有大补元气、补脾益肺的功效,两种功效截然不同。Park等[45]基于代谢组学技术,使用LC-QTOF-MS技术结合PCA、OPLS-DA及S-plot分析建立了西洋参和高丽人参的鉴别方法,研究发现皂苷Rf和Ra1是人参的特征标记物,皂苷F2是西洋参的特征标记物。
为了保证食品质量安全、保障消费者利益,对食品进行真伪鉴别具有非常重要的意义。代谢组学的最大优势在于它的整体分析能力以及外源性物质对生物的整体性效应,可以更好地反映外界环境对食品成分产生的微小差异。本文介绍了代谢组学的定义和基本研究思路,着重介绍了其在食品真实属性鉴别领域的应用,为代谢组学在该领域的研究提供了一定的参考依据。代谢组学研究需根据实验目的采集具有多样性和真实性的样品,在保留尽可能多的代谢产物的前提下进行简单预处理,选择合适的高分辨仪器检测,结合恰当的化学计量学技术进行分析。
不同品种的食品差异小,鉴别困难,需采集更多的代谢物数据才能有效地区分,常选择高通量的LC-QTOF-MS或GC-MS技术结合非监督PCA模型进行有效鉴定。产地鉴定需要忽略同一产地食品间的组内差异,放大不同产地的差异,适合采用监督型模型(PLS、LDA等)进行预测鉴定。品质监控通常通过挥发性物质和关键代谢产物来鉴定,适合采用GC-MS技术和1H-NMR技术配合化学计量学方法进行品质监控。食品掺假掺杂物方式繁多,需根据食品特点选择合适的仪器方法,先用非监督模型区分,再用监督型模型预测,才能达到较好的效果。
代谢组学技术也存在制约因素有待研究和突破,亟须开发价格适中、功能强大的仪器。此外,构建全面准确的代谢产物数据库,并与基因组、蛋白质组、转录组的数据库相互衔接,形成系统生物学数据链,将对食品质量与安全研究有指导意义。