近日,承启生物发布由其首席科学家、暨南大学张弓教授团队研发的一种方便操作、超高精度蛋白质全长测序方案,准确率可达99-100%,刷新了迄今为止的世界纪录。该方案使得蛋白质测序实用化,在生物学、医学、生物安全、法医物证等领域有广阔的应用前景。
蛋白质是由20种氨基酸组成的长链,是所有生命功能的实际执行者。氨基酸序列决定着蛋白质的功能,绝大多数疾病都是由于蛋白质的异常而导致的。虽然绝大部分蛋白质由基因转录翻译而来,但许多机制可以使蛋白质序列在这个过程中发生变化,一个基因可以产生少则一两种、多则几万种不同的蛋白质,因此对蛋白质的序列进行直接研究就尤为重要。
蛋白质测序的精准化和实用化,在许多领域可以产生前所未有的应用。例如,利用蛋白质测序比核酸测序更快速、更不容易被污染干扰的特点,癌症、老年痴呆等重疾的早筛和诊断将变得更加快捷方便;遇到生物安全事件(如重大疫情)时,蛋白质测序能几个小时内快速锁定病原体,大幅缩短疫情初期明确病原体的周期,为应对疫情争取宝贵时间;抗体药物研发过程中对筛选出的优秀抗体进行直接测序,将可以很快通过合成生物学方法大量生产这种抗体,大大缩短抗体药物的研发周期;蛋白质测序技术也可以轻松破解被国外垄断的蛋白质制剂,大幅度降低药品价格;测定从环境中分离到的具有优异特性的蛋白质,如细菌真菌中降解各种污染物的酶,加以改造和工业应用,可实现绿色环保低碳的发展目标。
蛋白质测序技术在1967年就已出现,这比基因测序技术早了约10年,然而现在基因测序技术已高度成熟发达,蛋白质测序技术却一直进展缓慢,完整度低、精准度低、成本高,导致蛋白质测序一直没有得到大范围的应用。这其中最 大的区别在于,DNA可以准确地进行复制或互补配对,几乎所有基因测序技术都基于此,而蛋白质无法复制,也无法依据序列来配对。
张弓教授团队在基因测序方面深耕多年,其全自主开发的FANSe系列核酸测序算法是迄今为止稳健性和准确性最 高的比对算法,同时具备很高的容错性。团队将基因组测序中的分步拼接和使用FANSe进行高精度校正的思想移植到蛋白质测序上,对蛋白质质谱分析进行了策略改进,对同一样品的多份质谱数据进行自我比对和校正,最终对蛋白质全长序列的测序准确度达到了空前的99-100%,甚至可以发现买来的标准品蛋白中存在着突变。在不同结构特性的多个蛋白质的测试中,一律能达到近乎完 美的全长测序结果,除非质谱仪测不出原始数据。更令人欣喜的是,这个策略甚至能应对质量较差的、有污染的实验数据,同样能稳健地输出准确的结果。实验操作简便,算法也大部分可自动化运行,因此这种方法成本低、速度快、易于推广。
正如基因测序精准化、廉价化之后引发人类生活和产业的巨变一样,蛋白质测序精准化、廉价化,将又一次给人类社会带来巨变。
目前,这一蛋白质测序方法的论文已在分析化学的权威期刊Analytical Chemistry上发表,算法可在承启生物网站上免费下载:http://chi-biotech.com/mucs/
参考资料:Highly Robust de Novo Full-Length Protein Sequencing, Anal. Chem. 2022, 94, 8, 3467–3475
合作咨询
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com