基于分子进化方法探究冠状病毒的进化

突然想起来之前做过冠状病毒的综述,找出来对比一下新型2019-nCov,相信有了之前的经验,新型病毒的研究能早有突破。

摘要

人冠状病毒(HCoV),包括SARS-CoV和MERS-CoV,是源自野生动物的人畜共患病原体。相对于其他病毒,HCoV具有更大的基因组,可编码特定结构蛋白以及非结构蛋白。其中,SARS病毒和MERS病毒给人类造成了尤其巨大的危害。本文总结了有关HCoV基因组分子进化的最新发现,重点关注造成新病毒基因型的突变和新性状的突变。

1. 分子进化的生物学意义

分子进化(molecular evolution)是指生物进化过程中生物大分子的演变现象。主要包括蛋白质分子的演变、核酸分子的演变和遗传密码的演变。

分子进化在研究物种进化关系中具有重要意义。上个世纪60年代,Zucherkandl提出分子钟[1]概念,即物种的同源基因之间的差异程度与它们的共同祖先的存在时间(即两者的分歧时间)呈线性关系。基于这个结论,我们可以借助蛋白质、核酸等生物大分子的进化情况判断物种的进化地位,在分子进化树中相距越远,物种进化水平也就越远。

同时分子进化在研究疾病发生中具有重要作用,我们可以根据序列的突变情况判断对生物进化有利的突变类型。

本文研究的文献Molecular Evolution of Human Coronavirus Genomes(PMID: 27743750)通过分析各类型冠状病毒的系统进化树以及在进化不同阶段发生的突变类型,分析冠状病毒感染人类的原因并探讨潜在的治疗方案。

2. 分子进化的相关工具

随着测序技术的普及和序列比对技术的日趋成熟,我们已经实现了利用大量生物分子数据构建分子进化的系统发育分析。截至目前,已有多种基于分子进化的手段构建系统发育分析的工具(表1)。

表 1 常用的系统发育分析工具

可以根据研究水平和所用算法对已有工具进行简单分类。

2.1基于研究水平的分类

  • 单个基因或蛋白序列的进化信息

  • 多基因或蛋白序列的进化信息

  • 全基因组序列的进化信息

2.2基于所用算法的分类

  • 基于字符序列的系统发育树重构算法:

最大简约法 MP 最大似然法 ML 贝叶斯 BI

  • 基于距离的系统发育树重构算法:

邻接法 NJ 非加权分组平均法 UPGMA

3. 进化选择压力

非同义突变的发生率与同义突变的发生率的比值(ω)称为进化选择压力。其中非同义突变的发生率为非同义突变SNP数/非同义位点数,同义突变发生率为同义突变SNP数/同义位点数。可以理解,当非同义突变数量多时,突变倾向于有利于生存;而当同义突变数量多时,突变倾向于不利于生存,即突变不会被物种保留。即:

1) 当ω>1时,向进化的趋势发展,多为共同进化;

2) 当ω<1时,消除有害突变,保留原基因。

4. 关于冠状病毒(Hcov)的介绍

冠状病毒是一种以脊椎动物为感染对象的病毒,主要感染病毒包括2002年在中国爆发的SARS冠状病毒(俗称非典)和2012年在沙特爆发的MERS新型冠状病毒(中东呼吸综合征)。其感染体,前者主要为蝙蝠、人类和果子狸等,后者主要包括蝙蝠、人类、羊驼以及骆驼等。主要表现为呼吸系统疾病。

5. 基于分子钟分析冠状病毒进化树

文章基于已有文献的数据[2-5],对于不同类型的Hcov病毒利用基于ML算法的RAxML软件绘制了系统发生树。

图 1 不同类型的Hcov病毒的系统发生树

基于系统发生树,我们可以得到冠状病毒的进化历史:SARS与MERS病毒都是近二十年进化出的新型冠状病毒,其祖代包括NL63、229E、OC43、HKU1病毒。进化关系如图:

图 2 冠状病毒的进化历史

6. 病毒突变情况分析

6.1 ORF结构蛋白突变

根据各种冠状病毒的基因比对,我们发现在SARSr-CoV病毒的ORF8蛋白序列在人类与蝙蝠中存在较大差异[7]。文献选择部分人类SARS冠状病毒(Human SARS-CoV)、灵猫SARS冠状病毒(Civet SARSr-CoV)以及蝙蝠SARS冠状病毒(SARSr-BatCoV),发现其他序列区域各物种差别不大,但ORF8序列蝙蝠病毒与其他两者具有较大差异,SARSr-BatCoV与Human SARS-CoV的同一性约为33%。

表 2 部分SARSr-CoV与灵猫SARSr-CoV SZ3的氨基酸序列同一性百分比

分析各物种各序列区域进化选择压力ω值(Ka/Ks,详细定义见3),发现该ORF8序列对应的ω值为3.5,远大于评估标准的1;与之相对的,在蝙蝠病毒中ORF8区域的ω值只有0.178/0.19。这说明人类SARS-CoV的ORF8区域突变确实导致了该病毒更加适应在人体内的生存。我们可以设想:在SARS-CoV病毒从蝙蝠转向人体的过程中,ORF8序列的突变型从原本的不利于生存转变为了有利于生存,为此我们可以通过研究ORF8区域突变情况分析SARS病毒在人类中传播的可能因素。

表 3 不同宿主之间SARSr-CoVs编码区的进化选择性ω值(Ka/Ks)

同样的,在祖型的HCoV-229E病毒研究中[8],我们同样发现蝙蝠病毒开始感染羊驼时也出现了相似的ORF蛋白序列缺失现象。

图 3 人(图下)与羊驼(图上)蛋白序列比对

6.2 MERS病毒S蛋白RBD序列突变

在对中东呼吸综合征的MERS-CoV序列比对分析中,有文献发现,伴随着从中东传入韩国,MERS病毒绝大多数基因组在病毒性穿刺蛋白(S蛋白)的受体结合域(RBD)都发生了点突变(分为D510G和I529T两种),与野生型RBD相比,这种突变会导致RBD对人CD26受体的亲和力降低[9]。经分析,人体CD26受体区域与体液免疫反应息息相关,MERS病毒通过突变以减少同抗体的结合,从而抑制机体免疫。

图 4 MERS病毒突变情况

图中蓝色三角表示同义突变,红色三角表示非同义突变

图中展示了穿刺蛋白(S蛋白)突变情况的详细情况,从图中可以看出,大部分样本都在S蛋白RBD区域出现了同义突变。

图 5 RBD区域结合情况

图中展示了野生型与突变RBD(D510G和I529T)对CD26的结合亲和力,可以看出,两种点突变都显著降低了RBD区域与CD26的结合。

6.3 229E病毒S基因缺失

在关于HCoV-229E的研究中,有文献指出,与蝙蝠病毒相比,人类病毒与羊驼病毒的S基因出现了缺失现象[10],下图A中HCov病毒和Alpaca病毒的S基因(图中Spike区域)明显短于BtCov该基因,下图B中可以看出,HCov-229E病毒S基因除了与羊驼病毒(Alpaca 229E)相似度极高外,与蝙蝠病毒相似度都在60%左右。

图 6 蝙蝠与人类冠状病毒N末端突变情况

这种缺失也存在于骆驼衍生的α-CoV中,同时这种突变表现为S基因的N末端结合区(NTD)出现了缺失现象[11]。

图 7 骆驼α-CoV 病毒突变情况

同时,在一篇研究猪呼吸道冠状病毒(PRCV)与传染性胃肠炎病毒(TGEV)差异的文章[12]中,作者发现两种病毒的序列相似性为96%,而二者的主要差别正好在于S基因N末端的缺失。而冠状病毒在蝙蝠感染阶段同样主要表现为肠胃疾病,而伴随着S基因N末端的缺失进入畜类及人类,冠状病毒主要表现为呼吸道疾病。我们知道,非典和中东呼吸综合征的主要病情均表现为呼吸困难,因此研究S 基因缺失与疾病表现之间的关系具有相当重要的意义。

7. 总结

本文主要介绍了应用分子进化技术研究冠状病毒的几个最新进展:

1) SARS与MERS病毒都是近二十年进化出的新型冠状病毒,其祖代包括NL63、229E、OC43、HKU1病毒,最可能由蝙蝠传入人体;

2) CoV的ORF8区域突变导致了该病毒更加适应在人体内的生存;

3) S基因RBD突变可以减少同机体抗体的结合,从而抑制机体免疫;

4) S基因N末端的缺失导致疾病由肠胃疾病转变为致死性的呼吸道疾病。

参考文献

  1. Zuckerkandl E. On the molecular evolutionary clock. J Mol Evol.1987;26(1-2):34-46. Review. PubMed PMID: 3125336.

  2. Chan, J. F., K. K. To, H. Tse, D. Y. Jin and K. Y. Yuen (2013). “Interspecies transmission and emergence of novel viruses: lessons from bats and birds.” Trends Microbiol 21(10): 544-555.

  3. Graham, R. L., E. F. Donaldson and R. S. Baric (2013). “A decade after SARS: strategies for controlling emerging coronaviruses.” Nat Rev Microbiol 11(12): 836-848.

  4. Lau, S. K., P. C. Woo, K. S. Li, A. K. Tsang, R. Y. Fan, H. K. Luk, J. P. Cai, K. H. Chan, B. J. Zheng, M. Wang and K. Y. Yuen (2015). “Discovery of a novel coronavirus, China Rattus coronavirus HKU24, from Norway rats supports the murine origin of Betacoronavirus 1 and has implications for the ancestor of Betacoronavirus lineage A.” J Virol 89(6): 3076-3092.

  5. Woo, P. C., S. K. Lau, C. S. Lam, A. K. Tsang, S. W. Hui, R. Y. Fan, P. Martelli and K. Y. Yuen (2014). “Discovery of a novel bottlenose dolphin coronavirus reveals a distinct species of marine mammal coronavirus in Gammacoronavirus.” J Virol 88(2): 1318-1331.

  6. Forni, D., R. Cagliani, M. Clerici and M. Sironi (2017). “Molecular Evolution of Human Coronavirus Genomes.” Trends Microbiol 25(1): 35-48.

  7. Lau, S. K., Y. Feng, H. Chen, H. K. Luk, W. H. Yang, K. S. Li, Y. Z. Zhang, Y. Huang, Z. Z. Song, W. N. Chow, R. Y. Fan, S. S. Ahmed, H. C. Yeung, C. S. Lam, J. P. Cai, S. S. Wong, J. F. Chan, K. Y. Yuen, H. L. Zhang and P. C. Woo (2015). “Severe Acute Respiratory Syndrome (SARS) Coronavirus ORF8 Protein Is Acquired from SARS-Related Coronavirus from Greater Horseshoe Bats through Recombination.” J Virol 89(20): 10532-10547.

  8. Crossley, B. M., R. E. Mock, S. A. Callison and S. K. Hietala (2012). “Identification and characterization of a novel alpaca respiratory coronavirus most closely related to the human coronavirus 229E.” Viruses 4(12): 3689-3700.

  9. Kim, Y., S. Cheon, C. K. Min, K. M. Sohn, Y. J. Kang, Y. J. Cha, J. I. Kang, S. K. Han, N. Y. Ha, G. Kim, A. Aigerim, H. M. Shin, M. S. Choi, S. Kim, H. S. Cho, Y. S. Kim and N. H. Cho (2016). “Spread of Mutant Middle East Respiratory Syndrome Coronavirus with Reduced Affinity to Human CD26 during the South Korean Outbreak.” MBio 7(2): e00019.

  10. Corman, V. M., H. J. Baldwin, A. F. Tateno, R. M. Zerbinati, A. Annan, M. Owusu, E. E. Nkrumah, G. D. Maganga, S. Oppong, Y. Adu-Sarkodie, P. Vallo, L. V. da Silva Filho, E. M. Leroy, V. Thiel, L. van der Hoek, L. L. Poon, M. Tschapka, C. Drosten and J. F. Drexler (2015). “Evidence for an Ancestral Association of Human Coronavirus 229E with Bats.” J Virol 89(23): 11858-11870.

  11. Sabir, J. S., T. T. Lam, M. M. Ahmed, L. Li, Y. Shen, S. E. Abo-Aba, M. I. Qureshi, M. Abu-Zeid, Y. Zhang, M. A. Khiyami, N. S. Alharbi, N. H. Hajrah, M. J. Sabir, M. H. Mutwakil, S. A. Kabli, F. A. Alsulaimany, A. Y. Obaid, B. Zhou, D. K. Smith, E. C. Holmes, H. Zhu and Y. Guan (2016). “Co-circulation of three camel coronavirus species and recombination of MERS-CoVs in Saudi Arabia.” Science 351(6268): 81-84.

  12. Rasschaert, D., M. Duarte and H. Laude (1990). “Porcine respiratory coronavirus differs from transmissible gastroenteritis virus by a few genomic deletions.” J Gen Virol 71 ( Pt 11): 2599-2607.