1. 质谱和蛋白质组数据分析算法开发
(1) 基于质谱的细菌鉴定算法
基质辅助激光解吸电离飞行时间质谱法(MALDI-TOF MS)是细菌鉴定的一种快速、可靠的方法。然而,现有的微生物质谱系统有两个问题待解决:一是难以区分一些亲缘关系比较相近的菌种;二是只能鉴定经纯化的单一细菌,不能直接鉴定细菌混合物。我们采用自助法对鉴定结果进行统计学评价来提高鉴定可靠性,成功实现对先前报道用质谱法难以区分的蜡样芽胞杆菌群(Bacillus cereus group)菌种的鉴定。利用非负线性回归谱图分解和基于刀切法的统计学评价,实现依靠现有纯细菌谱图数据库对混合细菌谱图的鉴定。
欢迎使用基于该算法的在线工具BacteriaMS(http://bacteriams.com/)。
(2) 基于深度学习的蛋白质组数据分析算法
数据非依赖性采集(DIA)是近几年来发展的一种新的质谱数据采集方式,对于大规模蛋白质组的定量分析具有显著优势,成为定量蛋白组学新的热门发展方向。目前,典型的DIA定量分析方法的基本流程是预先利用DDA采集构建谱图库,再利用谱图库从DIA数据中提取目标肽段的信号进行定量分析,这使得DIA数据分析受到DDA的限制。
我们基于卷积神经网络和循环神经网络的深度神经网络模型来预测肽段的串级质谱图(MS/MS)、归一化保留时间(iRT)和在质谱中的可检测性。与使用通用的模型来生成谱图库相比,专用于特定仪器的模型预测生成的谱图库质量更好,效果接近DDA构建的谱图库。还可以从物种蛋白序列数据出发,预测蛋白的理论酶切肽段的可检测性来构建谱图库。与考虑全部理论肽段相比,可检测性筛选能降低DIA分析的假阳性率。未来我们还将探索基于该方法的翻译后修饰(PTM)数据分析。
欢迎使用基于该算法的在线工具DeepDIA(https://deepdia.omicsolution.com/)。
代表性论文:
Y. Zong, Y. Wang, X. Qiu, X. Huang, L. Qiao*, Deep Learning Prediction of Glycopeptide Tandem Mass Spectra Powers Glycoproteomics, Nature Machine Intelligence, 2024, DOI: 10.1038/s42256-024-00875-x
Y. Zong, Y. Wang, Y. Yang, D. Zhao, X. Wang, C. Shen, L. Qiao*, DeepFLR Facilitates False Localization Rate Control in Phosphoproteomics, Nature Communications, 2023, 14, 2269
Y. Yang#, G. Yan, S. Kong, M. Wu, P. Yang, W. Cao#,*, L. Qiao*, GproDIA enables data-independent acquisition glycoproteomics with comprehensive statistical control, Nature Communications, 12(2021): 6073
Y. Yang, X. Liu, C. Shen, Y. Lin, P. Yang, L. Qiao*, In silico spectral libraries by deep learning facilitate data-independent acquisition proteomics, Nature Communications, 11(2020): 146
Y. Yang, Y. Lin*, L. Qiao*, Direct MALDI-TOF MS Identification of Bacterial Mixtures, Analytical Chemistry, 90 (2018), 10400–10408
Y. Yang, Y. Lin*, Z. Chen, T. Gong, P. Yang, H. H. Girault, B. Liu, and L. Qiao*, Bacterial Whole Cell Typing by Mass Spectra Pattern Matching with Bootstrapping Assessment, Analytical Chemistry, 89 (2017), 12556–12561
2. 微生物宏蛋白质组
2007年底美国国立卫生研究院启动人类微生物组计划(HMP),该项目研究结果表明,微生物群落是人体不可缺少的组成部分,与人类健康息息相关。随着高分辨率质谱的发展,宏蛋白质组学成为研究疾病和健康状态下肠道微生物功能的重要手段,它是指对特定时间内环境中所有微生物的所有组成的蛋白质的检测。宏蛋白质组学技术在微生物功能学领域具有重要的作用,是微生物功能学研究的重要方法之一。数据非依赖性采集(DIA)是近几年来兴起的一种新的质谱数据采集方式。基于DIA的定量宏蛋白质组具有通量高、稳定、准确性好等优点,对于大规模及复杂样品蛋白质组的定量分析具有显著优势。
许多研究结果表明结直肠癌(CRC)的发病机制与肠道微生物群的改变有关,我们收集了CRC患者和健康志愿者的粪便样本,并使用DIA非标定量宏蛋白质组学方法对其肠道微生物组进行了鉴定。总共鉴定到30063个蛋白和91902个肽段,它们分别归属于195个种属。并实现了对12000多个细菌蛋白的定量检测。在这些蛋白中,有341个蛋白在CRC患者和健康志愿者之间的丰度有显著差异。由于结直肠癌患者大肠局部高铁浓度和高氧化应激,与铁摄取/转运、氧化应激、DNA复制、重组和修复相关的微生物蛋白质显著地发生了变化。我们的研究表明,宏蛋白质组学可以提供肠道菌群的功能信息,这对研究肠道菌群的发病机制具有重要价值,并有助于指导临床诊断。
代表性论文:
E. Wu#, V. Mallawaarachchi#, J. Zhao, Y. Yang, H. Liu, X. Wang, C. Shen, Y. Lin, L. Qiao*, Contigs directed gene annotation (ConDiGA) for accurate protein sequence database construction in metaproteomics, Microbiome, 2024, 12: 58
E. Wu, Y. Yang, J. Zhao, J. Zheng, X. Wang, C. Shen, L. Qiao*, High-Abundance Protein-Guided Hybrid Spectral Library for Data-Independent Acquisition Metaproteomics, Analytical Chemistry, 2024, 96, 1029-1037
J. Zhao#, Y. Yang#, H. Xu#, J. Zheng, C. Shen, T. Chen, T. Wang, B. Wang, J. Yi, D. Zhao, E. Wu, Q. Qin*, L. Xia*, L. Qiao*, Data-independent acquisition boosts quantitative metaproteomics for deep characterization of gut microbiota, npj Biofilms and Microbiomes, 2023, 9: 4
S. Long#, Y. Yang#, C. Shen, Y. Wang, A. Deng, Q. Qin*, L. Qiao*, Metaproteomics characterizes human gut microbiome function in colorectal cancer, npj Biofilms and Microbiomes, 6(2020):14
3. 基于多组学的细菌耐药机制研究
细菌耐药性严重危害生命健康,并造成巨大经济损失。而在抗生素的刺激下,细菌做出的应激反应——丝状变长,能帮助其抵御抗生素的刺激并产生更加耐药的子代细胞。本课题组开展了基于微流控芯片和质谱联用的方法,来研究细菌受抗生素刺激发生形态变化时的多组学变化,进而研究细菌耐药的机制。
使用“圣诞树”型梯度微流控芯片和基质辅助激光解析离子化飞行时间质谱(MALDI-TOF MS)相结合的方法,研究在抗生素作用下的细菌形态变化过程及在这个过程中蛋白质组和转录组的变化。首先利用微流控芯片快速确定耐药菌的抗生素刺激培养条件,然后用MALDI-TOF MS检测该条件下发生形态变化的耐药菌的蛋白质组变化情况。并使用液相色谱串级质谱(LC-MS/MS),利用蛋白质组非标记定量的方法对结果进行验证,同时也在转录水平对结果进行了验证。
相比于蛋白质,代谢更能动态地反映细菌实时的整体状态。我们利用微流控芯片和电喷雾质谱(ESI-MS)联用技术,在线检测了发生形态变化的耐药菌的实时代谢水平,避免了传统代谢组学由于样品处理过程造成的代谢变化的问题,从而反映了细菌更加准确的代谢状态。根据差异代谢物我们锁定了其所在的通路,同时使用蛋白质组学的方法验正目标代谢通路中相关酶的变化情况。
代表性论文:
D. Zhang, F. Yin, Q. Qin, L. Qiao*, Molecular Responses During Bacterial Filamentation Reveal Inhibition Methods of Drug Resistant Bacteria, PNAS, 2023, 120, e2301170120
D. Zhang, Y. Yang, Q. Qin, J. Xu, B. Wang, J. Chen, B. Liu, W. Zhang*, L. Qiao*, MALDI-TOF Characterization of Protein Expression Mutation During Morphological Changes of Bacteria Under the Impact of Antibiotics, Analytical Chemistry, 91(2019), 2352-2359