新冠病毒(SARS-CoV-2)是一种带有包膜的病毒,带有一个约30 kb的正义单链RNA基因组。SARS-CoV-2与严重急性呼吸综合征病毒(SARS-CoV)和中东呼吸综合征冠状病毒(MERS-CoV)均属于β冠状病毒属。冠状病毒(CoVs)感染大多发生在鸟类和哺乳动物中。然而,SARS、MERS和目前的COVID-19的爆发说明CoVs具有超越物种壁垒并在人类之间传播的强大能力。
CoVs携带的基因组极其庞大(26~32kb),每个病毒转录本均具有5'- cap结构和3'- poly(A)尾巴。一旦病毒进入细胞后,基因组RNA的两个开放阅读框(ORFs)ORF1a和ORF1b会产生非结构蛋白(nsps)。ORF1a翻译成多聚蛋白1a(pp1a,440~500 kDa),随后被裂解成11个nsps。ORF1b翻译成大分子量的多聚蛋白(pp1ab,740~810 kDa),随后可被切割为16 个nsps。蛋白水解的过程分别由具有木瓜蛋白酶样蛋白酶结构域和3C样蛋白酶(3CLPro)结构域的病毒蛋白酶nsp3和nsp5介导。
nsp12介导病毒基因组的复制和转录。负义链RNA的中间体被用作合成正义基因组RNA(gRNA)和亚基因组RNA(sgRNA)的模板。gRNA由结构蛋白包装用于后代病毒体的组装。sgRNA编码保守的结构蛋白,如刺突糖蛋白(S)、包膜蛋白(E)、膜蛋白(M)、核衣壳蛋白(N)和一些辅助蛋白。根据当前研究显示(GenBank:NC_045512.2),已知SARS-CoV-2具有6个辅助蛋白,但是其ORFs尚未通过实验验证。
每个冠状病毒RNA都包含约70 nt的5'“前导”序列,该序列与基因组下游部分的序列融合。前导序列与下游序列融合发生在负链合成过程中的短基序中,被称为转录调控序列(TRS),紧邻ORFs。TRS包含一个含有6~7个碱基的保守核心序列(CS),其周围的为可变序列。在负链合成过程中,RdRP在穿过体内TRS时会暂停,然后将模板置换到前导序列中的TRS(TRS-L),这样会导致转录不连续。虽然上述复制和转录机制在其他冠状病毒中有所揭示,然而已知的机制是否适用于SARS-CoV2以及SARS-CoV-2转录组中是否有其他未知?这些都尚不清楚。
2020年4月23日,韩国基础科学研究院、首尔大学和韩国疾病预防控制中心的研究人员通过纳米孔直接RNA测序(Nanopore Direct RNA sequencing)和DNA 纳米球测序(DNA nanoball sequencing)技术对RNA样品进行了测序。纳米孔直接RNA测序可直接分析整个长病毒RNA,而不用事先将它片段化。DNA纳米球测序虽然只能读取短片段,但可以精确分析此部分序列。研究人员结合这两种技术对病毒RNA进行了剖析。测序结果显示,在病毒转录本上找到了至少41处RNA修饰位点,在这些修饰位点中,最常见的基序是AAGAA。在整个病毒基因组中都发现了“AAGAA样”基序上的修饰位点(包括AAGAA和其他富含A / G的序列),富集在28500~29500位置处。病毒RNA的Poly(A)尾巴平均由47个腺苷酸构成,修饰的RNA比未修饰的RNA具有较短的poly(A)尾巴。除了典型的基因组RNA和9个亚基因组RNA,SARS-CoV-2还可产生未知ORF且具有融合、缺失和(或)移码的转录本。在该项研究中,发现的未知转录本和RNA的修饰将为理解SARS-CoV-2的生命周期和致病机理提供参考意义。
原文参见“阅读原文”