化学性危害作为食源性危害的重要组成部分之一,通常不具急性临床症状而难以发现,食品中化学性危害物主要包括农业化学品、环境和加工过程污染物、药物残留、毒素、非法添加物等[1]。婴幼儿肌体机能未发育完善而成为食源化学性危害的易感人群,长期大量摄入含有化学危害物的婴幼儿配方乳粉会对婴幼儿造成严重健康损害[2],针对婴幼儿配方乳粉中的化学危害物分析[3-6]已成为食品质量安全控制的一个重要关注点,相比其他检测技术,质谱检测器以其更好的选择性和灵敏度而成为化学危害物分析的优先选择[7, 8]。相比传统的目标物定向分析(分析目标物被预设定)技术,基于高分辨质谱的全扫描技术理论上可以监测所有采集到的离子,允许对数据进行采集后分析,这种模式既可以进行定向的目标物分析,也可以进行不设定目标分析物的非定向分析[9-11]。非定向分析作为定向分析的补充,在食品安全分析领域主要用于检测和鉴别食品中不期望出现的、会导致或可能会导致健康危害的物质,这种具有食品安全风险识别能力的分析技术尤其契合当前婴幼儿配方乳粉因屡屡出现“非常规监测物质”而引发信心危机的状况。化学计量学概念是在1971年由瑞典科学家Svante Wold提出[12],是处理复杂分析数据和进行信息挖掘的有效工具,近年来其在化学分析领域应用更加深入与频繁[13-18],与高分辨质谱技术组合使用的报道多集中在食品真实性分析和溯源分析领域[19-21],随着仪器性能的提升和化学计量学软件的升级,高分辨质谱有机组合化学计量学形成“高信息量采集+信息挖掘分析”模式,极大地推动了非定向分析技术的发展,筛查化学污染物和监控相关物质非法使用的研究也逐渐增多[22-24]。在目前情况下,婴幼儿乳粉作为一类关注度较高的人工食品,使用高分辨质谱组合化学计量学方法开展非定向食源化学性危害分析具有重要现实意义。
本文以婴幼儿配方乳粉为目标基质,选择不同化合物种类、不同极性大小、法规不同要求(禁用和限用)及在日常婴幼儿配方乳粉监控检测中有要求[25]的6种化学药物:沙丁胺醇、林可霉素、磺胺嘧啶、螺旋霉素、双氯西林和醋酸甲地孕酮,采用人工添加的方式模拟未知化学危害物污染,15种不同的婴幼儿配方乳粉样品等量混合,用水复溶混匀后制备乳粉基质代表性乳粉溶液。乳粉溶液样品经乙腈提取,过滤性固相萃取柱去除蛋白和脂类基质组分,液相色谱-高分辨质谱分别采集“空白”(不含6种化合物)基质乳粉溶液样品(参照组)和添加乳粉溶液样品(添加组)的相关数据,使用化学计量学中的软独立建模分类方法(soft independent modelling of class analogy,SIMCA)拟合构建正交偏最小二乘法-判别分析模型(orthogonal partial least squares-discriminant analysis,OPLS-DA),以此区分参照组和添加组样品并识别添加的化学药物。
Shimadzu 30A快速液相色谱仪(日本岛津公司); 5600+ Triple TOF®四极杆/飞行时间质谱仪(美国SCIEX公司),配复合(DuoSpray)离子源,应用软件为Analyst TF (版本1.7); CR 22GⅡ高速冷冻离心机(日本HITACHI公司); KQ-100E台式超声波仪(昆山市超声仪器有限公司)。
乙腈为质谱级(美国Merck公司),水为Milli-Q Gradient系统制备的超纯水(电阻率18.2 MΩ·cm),甲酸为分析级(美国Sigma-Aldrich公司)。
沙丁胺醇(salbutamol,纯度98.5%)、林可霉素(lincomycin,纯度99.5%)、磺胺嘧啶(sulfadiazine,纯度99.5%)、螺旋霉素(spiramycin,纯度96.0%)、双氯西林(dicloxacillin,纯度99.0%)和醋酸甲地孕酮(megestrol-17-acetate,纯度99.0%)均购自德国Dr. Ehrenstorfer公司;Captiva NDLipids固相萃取柱(3 mL)购自Agilent公司。
除双氯西林外,分别取标准品各10.0 mg于10 mL棕色容量瓶中,用甲醇溶解并定容,配制成1.0 g/L的标准储备液;称取双氯西林10.0 mg于10 mL棕色容量瓶中,用纯水溶解定容,配制成1.0 g/L的标准储备液并分装(每次使用一份)。标准储备液均于-20 ℃保存。用甲醇稀释上述标准储备液,配制成不同浓度的混合标准工作液,现用现配。
选取来自国内、国外不同品牌不同配方的婴幼儿配方乳粉,采用相应的残留分析国家标准方法[26-31]对6种添加化学药物进行检测,以确认乳粉中是否含有相关物质。确认不含添加物质的婴幼儿配方乳粉,依据产地、配方组分表和品牌选取5类(每类乳粉产品均有3段不同配方设计,对应不同年龄段婴幼儿,共计15种样品),作为制备婴幼儿配方乳粉基质代表性乳粉溶液的原料。分别称取每种供试乳粉4.0 g(总重60.0 g)于500 mL玻璃烧杯中,加入240 mL纯水,玻璃棒搅拌混匀,以此作为婴幼儿配方乳粉基质代表性乳粉溶液,并以每份5.0 g分装到15 mL离心管中作为供试样本。
从制备好的样品中随机取17份为参照组。另取9份样品分别添加适量6种化合物混合标准溶液作为添加组,添加水平为50、100和200 μg/kg(以乳粉质量计),每个水平3个样品。同时单独取1份添加水平为200 μg/kg的样品作为质控(quality control,QC)样品,用于平衡分析系统和进行重现性评估。
每份试样加入6 mL乙腈,涡旋混匀1 min,于4 ℃ 10 000 r/min下离心10 min,取3 mL上清液过Captiva NDLipids固相萃取柱,收集滤出液。吸取2 mL滤出液于40 ℃以下氮吹至近干,加入0.5 mL乙腈-水(1∶9,v/v)超声复溶,过0.22 μm滤膜后进样分析。
CORTECSTM C18+色谱柱(100 mm×2.0 mm,1.6 μm);柱温40 ℃;流速0.3 mL/min;进样量30 μL;流动相A为0.3%(v/v)甲酸-5%(v/v)乙腈-水溶液,B为0.3%(v/v)甲酸-5%(v/v)水-乙腈溶液。梯度洗脱程序为:0~2.0 min,95%A; 2.0~6.5 min,95%A~80%A; 6.5~14.0 min,80%A~5%A; 14.0~16.0 min,5%A; 16.0~20.0 min,95%A。
电离方式:ESI+;采集模式:TOF MS-information dependent acquisition(IDA)-Product Ion; TOF MS扫描质荷比范围:m/z 100~1 000; TOF MS采集累积时间:0.2 s; IDA采集阈值:500 cps(勾选动态背景扣除); Product Ion采集累积时间:0.05 s;解聚电压:100 V;碰撞能量:35 V,扩展碰撞能量:15 V;离子释放延迟:67 V;离子释放带宽:25 V;离子源温度:550 ℃;雾化气压力:0.402 MPa;气帘气压力:0.134 MPa;辅助气压力:0.335 MPa;电喷雾电压:5 500 V。
样品数据采集之前先采用QC样品连续进样8次,平衡分析系统和观察仪器状况。本研究共有26个测试样品(17个参照组样品、9个添加组样品),每个样品随机采集2次数据,共计52个数据;添加组样品每针采集后要用试剂空白进行柱测试,防止交叉污染,9个添加组样品共需采集18次试剂空白数据,由此全部数据采集量为70个数据。将此70次数据采集分为7个批次提交,每个批次包括2针QC样品、10针测试样品、2针质谱质量轴校正(SCIEX APCI正离子校正液,PN.4460131)。QC样品和测试样按“QC-测试样-QC-测试样-QC”顺序排列,7个批次共计采集8个QC数据。
样品采集获得的数据采用SCIEX公司的MarkerViewTM(版本1.2.1.1)软件进行预处理。软件相关参数设置如下:最小的保留时间设定为0.5 min(过滤死体积);质量偏差容许设定为10×10-6(10 ppm);峰背景差减阈值为10次扫描;差减倍数因子为1.3;最小质谱峰宽25×10-6(25 ppm);最小的保留时间峰宽为8次扫描;噪声阈值为300 cps;最多峰发现数量为5 000。这些参数设定目的是保证软件能发现合理的色谱质谱峰并且在峰排列时进行合理的合并。
将预处理后的数据导入SIMCA-P(版本14.0,UMETRICS AB,瑞典)软件,使用软件的Omics组件拟合构建正交偏最小二乘法-差别分析模型,模型拟合构建中参照组和添加组的数据默认采用Pareto进行数据缩放和居中处理,拟合构建的模型质量采用3个参数(R2X (cum),R2Y (cum),Q2Y (cum))评估其拟合度和预测能力。
本研究采用人工添加化学药物的方法模拟婴幼儿配方乳粉受到未知化学危害物的污染,通过对比分析未污染对照组样品和已污染的添加组样品,探讨通过液相色谱-高分辨质谱组合化学计量学方法快速筛查婴幼儿配方乳粉中可能存在化学危害物的技术可行性,即未知目标物的非定向分析。
在实验方案的设计方面,首先,鉴于乳粉种类的多样性,婴幼儿乳粉基质代表性乳粉溶液的制备采用混合不同产地、配方和品牌的婴幼儿配方乳粉以获得具有相对基质代表性的乳粉溶液,并以此混合乳粉溶液来考察前处理方法和后续数据分析的有效性。实验共考察了10余类不同的婴幼儿配方乳粉,最终依据产地、配方组分和品牌选取了5类,每类含3种配方设计共计15种乳粉作为基质代表性乳粉溶液的制备原料。基质代表性乳粉溶液的制备中,乳粉与水的质量比设定为1∶4。一是保证乳粉的充分溶解形成均一溶液,二是考虑与乙腈混合提取的有效性(如提取效率、沉淀蛋白和浓缩难易度)。参照相关文献[32, 33]和预实验效果,最终设定水和乙腈的体积比为4∶6。其次,添加化合物的选择方面,6种物质共涉及β-受体激动剂类、林可酰胺类、磺胺类、大环内酯类、β-内酰胺类和孕激素类,这几类物质属乳粉基质的常见监控物质种类,且在极性差别和法规要求方面均有一定的代表性,因此选作模拟化学危害物的代表,用于考察前处理方法能否有效提取相关物质并考察色谱宽极性分离的有效性,以此更好地评估对于未知化学危害物的分析能力。6种用于添加的化学物质相关信息见表 1。不同的添加水平主要为了考察模型识别的灵敏度;相对较高的添加水平设计侧重于较高风险识别,残留限量规定不是主要的考量因素。
在实验方法的设计方面,非定向分析方法的前处理一般而言应满足几个要求[11]: ①方法应具有广谱性(即方法的选择性要低以覆盖更广范围的化合物种类); ②方法的重现性要好,尤其是涉及使用化学计量学技术来处理数据的情况;③方法应具有较高的处理通量。实现前处理方法的广谱性通常采用能在宽极性范围具有提取能力的溶剂,如甲醇、乙腈等,同时采用尽可能少的提取净化步骤以减少目标物分析数量和种类的损失。针对本研究,前处理采用混合极性的溶剂来扩充分析物提取范围,乳粉先用水溶解,让极性较大的物质进入水相,再采用乙腈提取中等极性和相对弱极性的组分,同时沉淀蛋白,采用Captiva NDLipids固相萃取柱过滤净化可有效去除可产生离子抑制的磷脂、蛋白以及表面活性剂等。前处理设计充分考虑了婴幼儿配方乳粉蛋白和脂类含量较高的特点[34],同时过滤净化的方式也兼顾了样品处理通量。色谱分离采用核-壳型C18色谱柱主要考虑宽极性范围分析物的分离,核-壳技术的填料可以获得较好的峰形和较低的背压;流动相选择较高的酸度主要考虑了酸性、碱性和中性物质的合理保留和整体的灵敏度;较缓的洗脱梯度是为了多组分更为充分的分离;设定质谱TOF MS扫描的范围为m/z 100~1 000,是控制化合物分析范围为有机小分子;IDA和Product Ion采集模式的使用则是备用于确认模型筛选出的化学危害物。
在上述设计和实验条件下,图 1为添加50 μg/kg的6种化合物时的TOF MS精确质量数提取离子流色谱图,6种物质可有效提取和监测,在色谱体系中的保留也显示其洗脱几乎覆盖了整个梯度变化过程,该结果说明了实验设计的有效性。
7个进样批次QC样品8次数据采集的情况见图 2。QC样品中同时含有基质组分和添加组分,其数据的情况可以完整地反映整个分析流程的信息。每个进样批次中,在批次始末均有QC样品数据,故通过QC样品8次数据的比较可有效地评估数据采集质量。由图 2可见,8次数据采集的谱图一致性良好,说明仪器分析系统在整个分析流程中稳定性良好。图 3给出了典型的参照组样品和添加组(50 μg/kg)样品的TOF MS总离子流图,参照组谱图与添加组谱图从目测角度而言无明显差别。在未知添加化合物的情况下,对样品是否含有化学危害物进行判断比较困难,因此引入化学计量学方法对数据进行信息挖掘是整个实验设计的关键。需要说明的是,在添加样本的数据采集中,分别有添加水平为50 μg/kg和200 μg/kg的2个样品共计4个采集数据无效(进样小瓶测试液液面过低,进样不足致总离子流响应很低),所以这4个数据被剔除不参与任何数据分析过程。由此,原有数据采集量为52个,实际参与分析的数据量为48个。
多变量统计分析是化学计量学方法处理数据的主要手段,其中SIMCA是基于主成分分析的一种监督分类方法,它将新的样本投射到一个特定的组别中成为其中的一员,并在该组别的特定主成分空间计算其欧氏距离(Euclidian distance),以此进行分类判别[18, 35]。在SIMCA中,正交偏最小二乘法-判别分析是在偏最小二乘法分析-判别分析(PLS-DA)的基础上发展而来的,其核心概念是将X变量方向的系统变异分为2个部分,一个部分与Y变量线性相关,一部分与Y变量正交即完全不相关。相比PLS-DA,该方法除显示组间变异外,还可显示组内的变异,因而更有利于模型的解释[35]。
除去4个被剔除的数据外,共48个数据经MarkerViewTM软件处理后,产生了由3 591个变量组成的数据集,这些变量均以“质荷比_保留时间”的格式表示。在48个数据中,参照组数据共计34个,添加组数据14个。将此48个数据分为模型拟合数据集(又称训练数据集)和模型验证数据集(又称预测数据集),其中33个随机数据(约占总数据量的2/3,其中参照组24个、添加组9个)用作模型的拟合((训练数据集),剩余15个数据用作模型的验证数据集(约占数据总量的1/3,其中参照组10个、添加组5个)。软件使用训练数据集获得OPLS-DA模型,然后再使用预测数据集对该模型进行验证,结果见图 4。
该OPLS-DA模型相关参数如下:R2X (cum)=0.742,R2Y (cum)=0.997,Q2 Y (cum)=0.905。R2X (cum)和R2Y (cum)表示使用模型所能解释的与X与Y变量的变异比例,其值越接近1说明模型拟合得越好;Q2Y (cum)与R2Y (cum)相似,区别是其值是通过交叉验证获取的,其值越接近1代表模型预测能力越好。图 4中椭圆区域标识了霍特林T2控制图 95%置信区间的范围,所有数据均在此区域说明没有异常值出现。OPLS-DA模型完成了良好的分组,参照组数据与添加组数据区分明显,而且添加水平低至50 μg/kg的数据也能被有效区分;此外,所有验证数据集中的数据使用该模型均得到了正确预测(验证数据通过预测计算均聚集于各自相对应的组别区域),预测正确率为100%,提示使用该模型可对含有化学危害物的乳粉样品进行有效预测,进而实现样品的筛查分析。另外,模型中横轴方向表示导致分组的最大变异(组间变异),纵轴方向表示与分组无关的最大变异(组内变异),由于参照组数据相对较多,其组内变异高于数据量较少的添加组组内变异(见图 4)。
在使用OPLS-DA模型对样本组别进行有效区分后,寻找区分参照组与添加组的变量就是识别潜在的化学危害物的过程。该过程主要使用OPLS-DA模型的S-Plot发现可靠的对组别区分有较大影响的变量。本研究OPLS-DA模型的S-Plot见图 5。
S-Plot的p[1]方向即横坐标轴方向表示每一个变量对组别区分的影响,值越靠近两端对分组的贡献越大;p(corr)[1]方向即纵坐标轴方向表示组别区分变量的可靠性,其值介于-1~1之间,越靠近1或-1的变量其可靠性越好。因此,在S-Plot中,两翼的顶部是需要重点关注的变量,也是代谢组学中生物标示物(biomarker)的识别区域,在本研究中则是化学危害物的识别区域。图 5的右上区域是添加组区别于参照组的变量识别区,在较高的p(corr)[1]值(0.7~1)区间又称高置信区域,变量数量总计为22个,对此22个变量依据其精确相对分子质量和保留时间信息导入仪器分析软件MasterviewTM(SCIEX公司,版本1.1)进行回溯分析,在合并重复变量(如加合离子、碎片离子、同位素离子等)和淘汰无效区分变量(如非规则峰导致的响应差异)后,6种添加的化学危害物在此区域全部被正确识别(见图 5中三角形标识的变量),6种物质被10个变量信息一一对应,相应的具体识别信息见表 2。在此需要强调的是,化学计量学方法处理结果和仪器分析软件数据结果组合应用方能有效挖掘数据信息,单独偏重某一方都会影响数据信息挖掘的有效性。至此,通过S-Plot将3 591个变量数据缩减为22个待分析变量数据,大大提高了数据分析效率和目标性,也充分证明了高信息量液相色谱-质谱数据组合化学计量学方法进行数据分析对于信息挖掘的有效性。
由表 2可见,10个变量分别对应于6种化合物的不同离子形态,包括分子离子、加合或碎片离子及同位素离子等,如沙丁胺醇和螺旋霉素的分子脱水离子、双氯西林的含37Cl同位素的分子离子以及醋酸甲地孕酮脱去醋酸根后的离子等。这些变量全部位于S-Plot的高置信区域(p(corr)[1]值均大于0.7)充分显示了所建立的OPLS-DA模型的特异性。另外,被识别的离子质量准确度如表 2所示,除螺旋霉素的质量偏差稍超过5×10-6(5 ppm)以外,其余所有离子质量偏差均小于5×10-6(5 ppm),说明整个分析期间仪器的质量校准轴是稳定的。
婴幼儿配方乳粉作为婴幼儿这一特殊群体的重要营养来源,其质量安全公众关注度极高。针对婴幼儿配方乳粉中可能的化学危害物,使用非定向分析技术进行筛查具有很高的应用价值,有利于技术支撑从被动应对到主动监控的转变。本文采用液相色谱-四极杆/飞行时间高分辨质谱组合化学计量学方法,对婴幼儿配方乳粉中采用人工添加模拟未知化学危害物进行了快速筛查分析研究,实验建立的高通量普适性前处理方法可有效提取6种代表性化合物,同时通过SIMCA-P软件对比分析参照组和添加组的液相色谱-高分辨质谱数据,拟合构建了灵敏度和特异性均较好的OPLS-DA模型,使用该模型可以有效区分参照组样品和添加组样品,可靠地识别模拟未知化学危害物而添加的6种代表性化合物。这一技术的建立是对非定向分析技术体系的有益探讨,可为婴幼儿配方乳粉质量安全的主动分析监控体系提供技术参考。
同时需要指出的是,尽管本文采用了15种乳粉来制备具有相对代表性的乳液基质,但实际检测中依然会存在由于基质组分差别而非化学危害物污染而带来的模型识别方面的挑战。进一步的工作,如建立婴幼儿配方乳粉基质组分数据库,将是一个可实践而且有效的方向。基质组分数据的积累在化学计量学方法处理中将有利于减少变量数据,以及有利于提高数据模型对基质组分不同的乳粉判别的有效性。