行业新闻

您的位置:首页 > 行业新闻

动物研究所科研团队发现:新冠病毒全球分歧时间远早于中国大陆

来源:中国科学院动物研究所日期:2023-03-24
新冠病毒(SARS-CoV-2)自2019年12月底首次被发现以来,已引发了全球公共卫生灾难,给人民生命财产和社会经济发展造成了巨大损失。至今,新冠病毒的起源仍不清楚。研究和揭示新冠病毒的起源和演化,对于正本清源、防控和预防新的病毒大流行具有紧迫性和必要性。

数据抽样如果存在严重的时空偏差,可导致病毒进化谱系缺失,影响对病毒起源时间和演化格局的估计。许多因素可导致抽样偏差,例如,早期病毒可被新突变株取代,其后代样品占比很少;由于症状较轻或不典型,有些地区的早期样品缺失。此外,如果病毒进化速率变异大,小样本估计会产生较大偏差。因此,有必要使用全球更多的新冠病毒序列数据,以减少估计偏差。

近期,中国科学院动物研究所科研团队建立了基于新冠病毒序列累计突变数来估计全球、各大洲及中国大陆新冠病毒分歧时间的模型。如图1A所示,假定病毒进化符合严格分子钟原理,即:每单位时间突变一个碱基。如果用于计算累计突变数的参考序列(L0灰色圆圈位置)是共同祖先,那么进化分支(L1,L2,L3,L4)的分歧时间(DT)应该均为零(图1B)。如果参考序列(如L1或L4灰色圆圈位置)不是共同祖先,各分支与参考序列的平均分歧时间不为零。例如,使用参考序列L1时, L1的分歧时间估计值(T0)应该是0; L2, L3, L4的T0应该是-4 (注:DT=T0/2) (图1C);使用参考序列L4时, L1和L2的T0应该是-4; L3的T0应该是-2;L4的T0应该是0(图1D)。T0估计采用病毒日累计突变数(Mt)与采集时间(t)线性回归法 (rDT法)。同样原理,可以估计每个病毒序列的日累计突变偏差数(dMt): dMt = Mt - a × t(a为新冠病毒平均日突变率)(iDT法)。分别使用参考序列为L0,L1和L4时,dMt估计值见图1E,F,G。根据dMt,可计算每条病毒序列的分歧时间(iDT):iDT =(dMt/a)/ 2。如果病毒进化速率不恒定,且变异是随机的,那么iDT估计值分布应符合钟型曲线。通过计算机模拟,验证了该模型的可靠性。使用2019年12月24日以来的全球255,039条SARS-CoV-2基因组数据和一条2019年12月31日的武汉参考序列(MN908947),利用rDT和iDT法,计算了全球和地区(六大洲、中国大陆)累计突变偏差数(dMt)和分歧时间(iDT)等参数(图1H)。

结果表明,新冠病毒累计突变数(Mt)与采集时间(t)呈三角或梯形关系(图H-Mt),说明进化速率既具有恒定性,又具有可变性,符合非严格分子钟原理。dMt和iDT分布基本呈钟型曲线(图H-All),说明进化速率变异具有随机性。全球平均dMt显著大于零,说明病毒分歧时间早于武汉参考序列的采集时间。

使用各洲新冠病毒平均进化速率,其rDT平均估计值是20.6天,排序如下:南美(36.2天)>北美(32.6天)>大洋洲 (21.2天)>非洲 (18.4天)>亚洲 (17.8天)>欧洲 (2.7天);除欧洲外,均大于中国大陆(9.1天)。使用各洲新冠病毒平均进化速率,其平均iDT为24.1天,排序为:南美 (39.7天)>北美 (36.0天)>大洋洲 (24.7天)>非洲 (22.0天)>亚洲 (21.3天)>欧洲 (0.9天) ;除了欧洲外,都显著大于中国大陆(9.7天)。rDT和iDT模型估计结果很类似。

发现全球(图S4)、欧洲、南美洲和大洋洲 (图1H-All)的dMt和iDT分布主峰的右侧还具有一个小峰(分歧时间大约对应于2019年9月),提示新冠病毒大流行发现之前可能已发生过一次大流行。

由于早期毒株往往被后期新出现流行株所取代,因此,代表古老分支的病毒样品很少,难以被rDT或平均iDT所反映。该文将超过2倍(2x)或4倍(4x)突变速率变异度的病毒序列定义为非期望高突变序列。结果表明,全球2x和4x非期望高突变序列的平均iDT为81.2天(n=4467)和175.3天(n=68);16个序列的iDT大于300天,分别对应2019年10月、6月、3月左右(图1H-2x, 4x)。各大洲2x和4x非期望高突变序列的平均iDT也均显著大于中国大陆(附表5、6)。但是,对于小样本结果(如分歧时间2019年6月或3月)仍需要进一步的检验。

综上,全球大多数新冠病毒样本与武汉参考序列的分歧时间在2019年12月,一些样本的分歧时间可追溯至2019年的10月、6月或3月左右;六个洲的平均及非期望高突变序列分歧时间(除欧洲的平均iDT外)都显著大于中国大陆。这些结果说明,新冠病毒全球分歧时间远早于中国大陆;或者说,新冠病毒被首次发现前已在全球广泛流行。因此,有必要在全球范围内开展新冠病毒的溯源研究。

图1。A:病毒进化示意图(假定符合严格分子钟原理)。B,E: 参考序列为L0时,对DT和dMt的估计。C,F: 参考序列为L1(图1A灰色圆圈位置)时,对DT和dMt的估计。D,G: 参考序列为L4时(图1A灰色圆圈位置),对DT和dMt的估计。H-Mt: 各洲新冠病毒累计突变数(Mt)与采集时间(t)的关系。H-All: 各洲新冠病毒分歧时间(iDT)核密度估计。H-2x,H4x: 各洲新冠病毒超过2或4倍突变速率变异度的非期望高突变序列的分歧时间(iDT)核密度估计。
图1。A:病毒进化示意图(假定符合严格分子钟原理)。B,E: 参考序列为L0时,对DT和dMt的估计。C,F: 参考序列为L1(图1A灰色圆圈位置)时,对DT和dMt的估计。D,G: 参考序列为L4时(图1A灰色圆圈位置),对DT和dMt的估计。H-Mt: 各洲新冠病毒累计突变数(Mt)与采集时间(t)的关系。H-All: 各洲新冠病毒分歧时间(iDT)核密度估计。H-2x,H4x: 各洲新冠病毒超过2或4倍突变速率变异度的非期望高突变序列的分歧时间(iDT)核密度估计。

研究论文“SARS-CoV-2 shows a much earlier divergence in the world than in the Chinese mainland”已在线发表在期刊《中国科学:生命科学》(SCIENCE CHINA Life Science)上。中国科学院动物研究所博士后程超源为论文第一作者,中国科学院动物研究所张知彬研究员为该论文通讯作者。该研究得到了科技部重点研发项目(2021YFC0863400)和中国科学院动物研究所项目(E0517111; E122G611)的支持。

参考文献:Cheng C., Zhang Z. SARS-CoV-2 shows a much earlier divergence in the world than in the Chinese mainland. Sci China Life Sci (2023).

论文连接:https://www.sciengine.com/SCLS/doi/10.1007/s11427-023-2294-5