半乳糖凝集素是一类进化上十分保守的可溶性凝集素蛋白质。半乳糖凝集素含有一个或两个长约130个氨基酸的糖识别结构域(CRD), 对β-半乳糖苷具有特异的亲和力[1, 2]。迄今, 已有约15种哺乳动物的半乳糖凝集素家族蛋白质被报道, 根据CRD数目可被分为三大类:单一CRD的原型, 两个CRD的串联重复型, 以及含有一个CRD和一个胶原蛋白质样重复结构域的嵌合型[3]。其中, 半乳糖凝集素-3(Gal-3)是嵌合型中的重要成员[4], 普遍存在于动物体内, 主要通过非经典途径分泌产生[5]。在人体内, Gal-3由位于14号染色体q21-22位点上的LGALS3基因编码产生, 在N端含有一个CRD区域, 能与β-半乳糖及其缀合物特异性结合[6]。据报道, 人源的Gal-3能与细胞内大量的糖蛋白相互作用, 参与多种生物学过程, 如细胞黏附、增殖、活化、凋亡等[7-10]。
凝集素的CRD已被广泛应用于糖蛋白/糖肽的富集与识别中, 但目前绝大部分商业化凝集素都是植物凝集素, 例如对高甘露糖具有特异亲和力的伴刀豆凝集素、对N-乙酰葡萄糖氨和唾液酸具有特异亲和力的麦胚凝集素、对半乳糖具有特异亲和力的蓖麻凝集素等[11-15]。这些凝集素已在线虫、鼠肝、血清、尿液等复杂样本的糖蛋白质组富集分析中得到广泛应用[16, 17], 但至今鲜有动物凝集素应用于糖蛋白质组的富集研究。因此, 本研究基于人源Gal-3的CRD序列特征, 在原核表达系统中构建了含有1个或4个串联重复CRD结构域的重组Gal-3分子, 并通过生化手段对其相对分子质量、纯度、生物素化和糖蛋白结合特征等进行了综合分析。随后, 将重组的凝集素蛋白质固定到链霉亲和素琼脂糖小球上, 形成凝集素亲和柱, 应用于糖蛋白质组的富集分析研究中。
菌种:人肝癌细胞系HepG2细胞株购自美国模式培养物集存库(ATCC), 本实验室保存。大肠杆菌BL21(DE3)菌株购自中国康为世纪生物科技有限公司。PET28a-gal3c(单体)、PET28a-Gal3c(四聚体)和pBirA质粒购自中国华大基因股份有限公司, 由本实验室保存。
培养基:细菌培养基为LB培养基(胰蛋白胨10 g/L, 酵母提取物5 g/L, 氯化钠10 g/L, pH 7.4, 121 ℃, 30 min), 低于55 ℃时加入抗生素, 固体培养基加1.5%(m/m)的琼脂粉。细胞培养基为DMEM培养液(10%(v/v)胎牛血清, 60 mg/L青霉素和100 mg/L链霉素)。
试剂:三羟甲基甲烷、丙烯酰胺粉末、N, N-亚甲基二丙烯酰胺购自美国Bio-Rad公司; 四甲基乙二胺、十二烷基磺酸钠购自美国Promega公司; 镍亲和纯化凝胶(Ni-NTA-Agarose)购自中国克劳宁生物科技有限公司(北京); 所用无机盐类、乙酸、乙醇、考马斯亮蓝G250、EDTA等均为国产分析纯, 购自国药试剂公司; 实验所用咪唑、卡那青霉素、链霉素、四环素、氯霉素等均购自中国生工生物科技有限公司(上海); 消化细胞用的胰蛋白酶-乙二胺四乙酸(胰酶-EDTA)消化液、细胞培养用的青霉素和链霉素双抗混合溶液、无菌磷酸缓冲盐溶液(PBS)均购自美国Hyclone公司; 胎牛血清(BSA)购自美国Gibco公司; 牛胎球蛋白、去唾液酸的牛胎球蛋白、牛脱铁转铁蛋白、马心肌红蛋白、核糖核酸酶B、生物素均购于美国Sigma公司; 生物素化的伴刀豆凝集素A、麦胚凝集素、小扁豆凝集素、鸡冠珊瑚树凝集素均购于德国Vector公司; 辣根过氧化物酶标记链霉亲和素(HRP-链霉亲和素)、二氨基联苯胺(DAB)和增强化学发光(ECL)试剂盒均购于中国康为世纪公司; 蛋白胶预染的标准蛋白质、链霉亲和素琼脂糖小球和旋转柱均购于德国Thermo公司; 亲水色谱(HILIC)填料购于中国博纳艾杰尔公司; Cocktail蛋白酶抑制剂购于瑞士Roche公司。
仪器:串联质谱Q-Exactive HF、二氧化碳培养箱、离心机购、Nanodrop 2000型微量紫外光度计购于德国Thermo公司; 高压灭菌锅购于日本Panasonic公司; 超声波破碎仪购于中国宁波新芝生物科技股份有限公司; 伯乐电泳仪和电泳槽购于美国Bio-Rad公司; 凝胶扫描仪购于中国惠普有限公司; 超净工作台购于中国北京东联哈尔仪器制造有限公司; 脱色摇床购于中国冠森生物科技有限公司; -80 ℃超低温冰箱购于日本Sanyo公司; 电热恒温培养箱购于中国上海浦东荣丰科学仪器有限公司; 台式恒温振荡器购于中国苏州培英实验设备有限公司。
根据人半乳糖凝集素-3的cDNA序列(Gene bank: CR542097.1)及已知的Gal3C结构, 选取了其331~753位的核苷酸序列作为Gal3C的编码序列。同时, 在该序列的3′端添加了一段编码Avi-tag的核苷酸序列:GTC TGA AAC GAC ATC TTC GAG GCT CAG AAA ATC GAA TGG CAC GAA, 得到全长的片段。将该片段通过EcoR1和Xho1插入pET28a载体中, 获得pET28a-Gal3C表达质粒。为了获得Tetra-Gal3C, 在各个编码片段之间加入柔性氨基酸标签编码序列GGC GGT GGT GGT GGT GGC, 同时进行了密码子优化。DNA重组片段的合成以及质粒构建实验由华大基因完成。将质粒转化到感受态细胞之后, 通过卡那霉素和氯霉素的双重抗性筛选平板选择共表达的BL21(DE3, Gal3C/BirA)和BL21(DE3, Tetra-Gal3C/BirA)菌株。
人肝癌细胞系HepG2使用DMEM培养液培养, 在37 ℃含5%(v/v)二氧化碳及95%(v/v)空气饱和湿度温箱中常规培养。细胞每24 h传代培养, 48 h后用0.25%(m/m)胰酶-EDTA溶液消化收集细胞。
在50 mL离心管中加入5 mL含50 μ g/mL卡那霉素和34 μ g/mL氯霉素的LB培养基, 分别接入两种含不同质粒的菌种进行活化。置于摇床上, 37 ℃ 200 r/min条件培养过夜(~12 h)。活化后的菌种分别转入含150 mL LB培养基的三角瓶中, 置于摇床上37 ℃ 200 r/min条件培养约2 h, 至菌溶液在600 nm波长处的吸光值(OD600)约为0.5时为止。降温至30 ℃, 向三角瓶中加入0.2 mmol/L的异丙基- β-D-硫代半乳糖苷(IPTG)和10 μ g/mL的生物素, 进行目标蛋白质诱导和生物素化。37 ℃ 160 r/min条件下继续培养8 h后转入离心管中, 4 ℃ 6 000 r/min条件下离心5 min, 弃上清并收集菌体。用PBS缓冲液洗涤菌体后提取目标蛋白质(Gal3C和Tetra-Gal3C)。
加入20 mL预冷的结合缓冲液(25 mmol/L Tris-HCl, 500 mmol/L pH 7.8的NaCl, 含Cocktail蛋白酶抑制剂)重悬菌体, 使用超声进行破菌。10 000 g下离心30 min, 保留的上清即为全蛋白提取液。活化Ni-NTA-Agarose柱后, 将全蛋白提取液重复过柱3次, 让目标蛋白质结合到镍柱上。用40 mL的洗涤缓冲液(25 mmol/L Tris-HCl, 500 mmol/L pH 6.0的NaCl)洗去非特异性结合的蛋白质, 最后用250 mmol/L咪唑洗脱并收集目标蛋白质。
透析袋用水洗干净, 用透析夹夹住底部, 加入高浓度咪唑洗脱下来的目标蛋白质溶液后, 用透析夹封口, 置于含1 L透析液(50 mL pH 7.8的10×PBS, 400 mL水, 50 mL甘油)的烧杯中, 用保鲜膜封口后置于4 ℃冰箱, 磁力搅拌器搅拌过夜(约12 h), 得到纯化的含低浓度咪唑的目标蛋白质。
利用Bradford方法对目标蛋白质进行定量, 利用十二烷基硫酸钠-聚丙烯酰胺凝胶(SDS-PAGE)电泳方法评估蛋白质的相对分子质量及纯度。利用Nanodrop对富集到的糖肽进行定量分析。
标准蛋白质或全蛋白提取液用SDS-PAGE分离, 然后转印到聚偏二氟乙烯膜(PVDF)上。PVDF膜置于封闭液(1×Tris-HCl缓冲盐溶液(TBS), 0.05%(v/v)吐温20, 5% (v/v) BSA)中, 室温封闭1 h。用含有0.05%(v/v)吐温20的TBS (TBST)溶液清洗后, 按1 : 5 000体积比加入生物素化的Gal3C或Tetra-Gal3C或植物凝集素, 4 ℃孵育过夜。用TBST清洗后, 按体积比1 : 5 000加入HRP-链霉亲和素, 室温孵育1 h。TBST清洗后, 加入DAB或ECL试剂进行显影。
加200 μ L的链霉亲和素琼脂糖小球到旋转柱中, 用200 μ L预冷的PBS平衡柱子2次。加入500 μ g的Gal3C或Tetra-Gal3C, 4 ℃旋转孵育1 h固定目标蛋白质, 即为凝集素亲和柱。用注射器推压收集未结合的目标蛋白质并用PBS洗涤2次。
加入标准蛋白质或全蛋白提取液(HepG2细胞用PBS和0.1%(v/v)Triton X-100重悬, 使用超声破碎提取的全蛋白溶液)到该凝集素亲和柱中, 4 ℃旋转孵育过夜。置于冰上自然沉淀, 注射器推压收集未结合蛋白质并进行蛋白质浓度测定。用400 μ L的PBS洗涤非特异性结合蛋白质。加100 μ L的8 mol/L尿素溶液到该凝集素亲和柱中洗脱糖蛋白, 37 ℃旋转孵育30 min。用注射器推压收集洗脱液, 重复洗脱一次, 洗脱液包含富集的糖蛋白。
将洗脱液加入到30 kD的超滤管中, 加200 μ L的8 mol/L尿素溶液, 14 000 g下离心10 min。加入终浓度20 mmol/L的二硫苏糖醇, 在37 ℃还原反应4 h, 之后加入终浓度50 mmol/L的碘乙酰胺, 室温暗处反应30 min。用200 μ L的50 mmol/L碳酸氢铵替换溶液。更换新的套管, 按胰蛋白酶和糖蛋白质量比1 : 50加入胰蛋白酶, 在37 ℃旋转反应过夜, 14 000 g下离心10 min, 收集酶切肽段。真空冷冻干燥肽段, 用0.1%(v/v)甲酸复溶后取500 ng进行质谱分析。
生物质谱仪为串联质谱Q-Exactive HF。反相色谱直喷柱采用Magic C18柱(内径150 μ m, 柱长12 cm, C18填料直径为3 μ m)。然后利用流动相A液为含有0.1%(v/v)甲酸的超纯水, B液为含有0.1%(v/v)甲酸的纯乙腈, 线性梯度为6%B~32%B, 流速0.6 μ L/min, 进行78 min的液相色谱分离, 随后进Q-Exactive HF质谱检测。Q-Exactive HF质谱检测条件:碎裂模式为高能碰撞解离模式(HCD), 电离方式为纳升级电喷雾电离(Nano-ESI), 采用正离子模式进行扫描, 电离电压采用默认设置, 一级质谱离子扫描的范围为300~1 400 Da, 分辨率为120 000, 自动增益控制(AGC)设置为3×106, 最大注入时间(IT)设置为80 ms; 二级质谱Top N设置为20, AGC设置为5×104, 最大IT设置为45 ms, 动态排除时间设置为12 s, 质量数据由XCalibur进行实时采集。
质谱分析获得的RAW文件使用MaxQuant软件(1.5.3.8版)进行分析。参数设置:酶切方式为Trypsin, 最大漏切位点为2。固定修饰设置为Carboxyamidomethylation (C); 可变修饰设置为Acetyl (Protein N-term)、Oxidation (M); 其他参数均为默认值。
重组构建了含有CRD结构域的人源半乳糖凝集素-3, 依据CRD结构域数目分别命名为Gal3C和Tetra-Gal3C。为了更好地分离纯化重组凝集素蛋白质, 在两种凝集素蛋白质上均构建了两个His标签, 便于使用镍柱(Ni-NTA-Agarose)分离纯化。同时, 还构建了一个由15个氨基酸残基组成的Avi标签, 为固定化到链霉亲和素琼脂糖小球提供专一性结合位点[18]。Gal3C含有199个氨基酸, 大约为22.5 kD; Tetra-Gal3C含有639个氨基酸, 大约为71.1 kD。如图 1a所示, 通过镍柱分离纯化后, 获得了高纯度的重组半乳糖凝集素Gal3C和Tetra-Gal3C, 纯度大于95%。为了评估重组半乳糖凝集素与链霉亲和素的特异亲和力, 选取了HRP-链霉亲和素作为抗体进行了免疫印迹分析[19]。如图 1b所示, 重组半乳糖凝集素Gal3C和Tetra-Gal3C与HRP-链霉亲和素发生明显的相互作用, 即Gal3C和Tetra-Gal3C成功发生了生物素化。
如图 2所示, Gal3C仅含有一个CRD结构域, 而Tetra-Gal3C通过聚甘氨酸接头连接了4个CRD结构域。同时, Gal3C和Tetra-Gal3C均含有两个His标签和一个Avi标签, 并发生生物素化修饰。当Gal3C和Tetra-Gal3C与链霉亲和素琼脂糖小球混合孵育时, 由于生物素环形结构中的咪唑酮环能与链霉亲和素发生共价结合[20], 致使重组凝集素特异性地固定于链霉亲和素琼脂糖小球上, 制作成凝集素亲和柱, 进而可应用于糖蛋白/糖肽的亲和富集。
人源的半乳糖凝集素-3偏向于识别并结合N-糖蛋白, 特别是含有N-乙酰乳糖胺修饰的糖蛋白[21]。为了验证重组凝集素是否具有相似的糖蛋白富集特性, 利用6种标准蛋白质对其进行验证, 包括去唾液酸的胎球蛋白A(AF)、牛血清白蛋白(BSA)、胎球蛋白A(F)、马心肌红蛋白(Mb)、核糖核酸酶B(RB)、牛转铁蛋白(T)。其中, AF、F、RB和T是N-糖蛋白, BSA和Mb是非糖蛋白。如图 3a所示, 6种标准蛋白质的纯度均在90%以上, 但由于BSA与AF和F的分子量较为接近, 最终采用了5种标准蛋白质的混合物进行糖蛋白富集分析, 不包括BSA。
为了评价重组凝集素对N-糖蛋白的特异性识别和结合能力, 进行了凝集素免疫印迹分析, 即将生物素化的重组半乳糖凝集素-3(Gal3C和Tetra-Gal3C)作为“一抗”, 与转印到PVDF膜上的标准蛋白质混合孵育, 洗涤之后与HRP-链霉亲和素孵育, 最后用DAB或ECL试剂盒显色。如图 3b和3c所示, Gal3C和Tetra-Gal3C均能结合N-糖蛋白AF、F、RB和T, 而不与非糖蛋白BSA和Mb结合, 表明生物素化的重组凝集素作为“一抗”检测灵敏度高, 且具有N-糖蛋白的特异性识别和结合能力。
为了评估重组凝集素亲和柱的糖蛋白富集效能, 将Gal3C和Tetra-Gal3C固定到链霉亲和素琼脂糖小球上, 利用形成的重组凝集素亲和柱去富集5种标准蛋白质混合物中的糖蛋白。如图 3d和3e所示, 5种标准蛋白(AF、F、Mb、RB和T)具有不同的相对分子质量, 其混合物能够在SDS-PAGE胶上清晰地分为5个标准的蛋白质条带。经过Gal3C和Tetra-Gal3C凝集素亲和柱富集后, 3种N-糖蛋白(AF、F和T)都得到了明显的富集, 特别是AF糖蛋白。结果表明Gal3C和Tetra-Gal3C凝集素亲和柱对N-糖蛋白具有特异的识别和结合能力。此外, 在洗涤液中也鉴定到了5种标准蛋白质的蛋白质条带(见图 3d和3e), 这是因为每种蛋白质的糖基化修饰程度并不相同, 未发生修饰或弱结合的蛋白质都被洗涤出来。同时, 进一步验证了Tetra-Gal3C凝集素亲和柱对3种N-糖蛋白的亲和性。如图 3f所示, Tetra-Gal3C对3种N-糖蛋白(AF、F和T)都表现出了良好的亲和特性, 特别是AF糖蛋白。综上所述, 这些结果都表明重组凝集素亲和柱能特异性地结合N-糖蛋白, 具有应用于糖蛋白质组富集分析的潜能。
为了评估重组Tetra-Gal3C凝集素对糖链的亲和特异性, 选用了4种植物凝集素对6种标准蛋白质进行了免疫印迹分析[22, 23], 包括伴刀豆凝集素A(ConA)、麦胚凝集素(WGA)、小扁豆凝集素(LCA)、鸡冠珊瑚树凝集素(ECA)。据文献报道[11-13, 24], ConA可特异性地与高甘露糖型糖链亲和作用, WGA可特异性地与β1-4或β1-2连接的N-乙酰葡萄糖胺及唾液酸糖链亲和作用, LCA可特异性地与高甘露糖型糖链亲和作用, ECA则特异性地与末端为半乳糖或N-乙酰半乳糖胺糖链亲和作用。如图 4所示, F蛋白倾向与WGA亲和作用, 表明其唾液酸糖链较多; AF蛋白倾向与ECA亲和作用, 表明其含有半乳糖或N-乙酰半乳糖胺糖链; RB蛋白和T蛋白能与4种植物凝集素结合, 表明含有多种糖链; 而BSA和Mb蛋白均不与植物凝集素结合, 表明这两类蛋白都不含有糖链。综上所述, 重组的人源凝集素Gal3C和Tetra-Gal3C与植物凝集素ECA类似, 两者都能与含有N-乙酰半乳糖胺修饰的AF蛋白发生亲和作用, 并且具有较高的选择性和特异性, 因此可适用于此类糖蛋白/糖肽的富集。
为了进一步评估重组凝集素的糖蛋白/糖肽富集能力, 将50 μ g的AF肽段分别使用糖肽富集材料HILIC、重组凝集素材料Gal3C和Tetra-Gal3C进行富集分析。通过定量比较分析, 发现凝集素材料Tetra-Gal3C能够富集到更多的AF蛋白的糖肽, 约为凝集素材料Gal3C的1.5倍和HILIC材料的2倍(见图 5)。这一结果表明, Tetra-Gal3C由于含有4个串联重复的CRD结构域, 因而具有更高的糖肽负载量, 能够结合更多的糖肽。然而, Tetra-Gal3C的4个CRD结构域排列紧密, 导致富集的糖蛋白或糖肽在空间结构上存在一定的位阻排斥效应, 因此富集的糖肽含量不足Gal3C的4倍。同时, 也发现凝集素材料对AF蛋白的糖肽富集率均高于HILIC, 表明重组凝集素材料对N-乙酰半乳糖胺糖肽具有更高的亲和性。
进一步评估了重组凝集素Gal3C和Tetra-Gal3C在复杂样本中富集糖蛋白/糖肽的能力。如图 6a和6b所示, 重组凝集素Gal3C和Tetra-Gal3C从HepG2细胞全蛋白(H)中富集了大量的糖蛋白。同时, 观测到大量非糖蛋白未被重组凝集素富集, 表明重组凝集素具有糖蛋白亲和特异性。然后利用重组凝集素作为“一抗”进行免疫印迹分析, 通过ECL和DAB显影, 发现重组凝集素Gal3C和Tetra-Gal3C能够明显地与大量糖蛋白结合, 且两种凝集素结合的蛋白非常类似, 如图 6c和6d所示。其中Tetra-Gal3C对某些特异的糖蛋白表现出了更强的亲和能力, 导致显影更加明显。
利用空载的链霉亲和素琼脂糖小球作为空白对照, 进一步分析了重组凝集素Gal3C和Tetra-Gal3C亲和柱的糖蛋白富集能力。与对照组相比, 重组凝集素Gal3C和Tetra-Gal3C亲和柱均从HepG2细胞全蛋白中特异性的富集到了208种UniProt数据库中已知的糖蛋白。Tetra-Gal3C对其中的106个蛋白表现出了更高亲和性, 富集到的糖蛋白峰度明显大于Gal3C富集到的糖蛋白峰度(>1.5倍, 见图 7)。其中, SLC7A1、ABCC4和NPC1 3个蛋白的富集倍数差高达9倍。相对Tetra-Gal3C而言, 仅有44个糖蛋白表现出对Gal3C更高的亲和性(<0.75倍, 见图 7)。通过热图对比分析150个差异富集糖蛋白的蛋白质峰度, 也发现两种材料对这150个糖蛋白有特异的亲和性(见图 8)。由此我们认为, Tetra-Gal3C由于具有四重串联的CRD结构域, 相对于仅有一个CRD结构域的Gal3C而言, 具有更高的糖链负载量, 能够富集更多的糖蛋白。空间结构原因可能导致Tetra-Gal3C对少量糖蛋白的富集能力相对减弱, 因此Gal3C表现出了更高的富集特性。总体说来, 这一结果表明重组凝集素亲和柱具有从复杂生物样本中富集糖蛋白/糖肽的潜能, 可应用于复杂样本的糖蛋白质组富集分析。
半乳糖凝集素-3是半乳糖凝集素家族中的重要成员, 具有广泛的生物学功能, 参与细胞的黏附、增殖、凋亡等生物学过程[25-27]。本文聚焦于半乳糖凝集素-3的CRD结构域在糖蛋白质组富集分析中的应用。首先, 利用基因重组技术构建了一组含有一个或四个串联重复CRD结构域的人源半乳糖凝集素-3: Gal3C和Tetra-Gal3C。其次, 通过生化表征和标准蛋白评估, 证明了重组人源半乳糖凝集素具有糖链识别和结合的特异性, 尤其是对N-乙酰半乳糖胺修饰的糖蛋白/糖肽具有显著的亲和特性。最后, 将其固定化到链霉亲和素琼脂糖小球制作成凝集素亲和柱, 应用于复杂生物样本中的糖蛋白/糖肽富集分析, 并取得了良好的富集效果。因此, 证明人源重组凝集素具有富集糖蛋白/糖肽的能力, 可适用于复杂生物样本的糖蛋白质组富集分析。
综上所述, 本文建立了人源重组半乳糖凝集素Gal3C和Tetra-Gal3C的表达和制备方法, 为人源半乳糖凝集素的生物功能研究提供了可能的实验材料。同时, 基于重组哺乳动物凝集素糖结合结构域, 提供了一种新的糖蛋白质组富集策略, 有望推进复杂生物体系糖蛋白质组的研究。