鳍足分枝杆菌菌株基因组测序南美海狮的遗传特征和双重感染证据
文丨七号记编辑丨七号记
针状分枝杆菌是结核分枝杆菌复合体(MTBC)的成员,能感染多种宿主包括人类。研究人员意外发现的一只海狮存在混合菌株感染,表明鳍足分枝杆菌在该种群中高度流行。
通过研究发现,离株的鳍足分枝杆菌蛋白质组显示出高度的保守性,因此要进一步对基因组进行测序和分析。
南美海狮的尸体(黄耳蕨)是在巴西南里奥格兰德州南部海岸发现的,由于巴西没有这些动物的繁殖地,所以在海岸发现的标本可能来自乌拉圭。动物尸检中,在不同的器官中发现了与结核相容的病变,从这些病变中研究人员在巴西海岸获得了这种病原体的第一份报告。
一、羽分枝杆菌基因组蛋白质组圆形图谱
羽分枝杆菌基因组蛋白质组圆形图谱与结核分枝杆菌H37Rv参考基因组的比较。从外环到内环:基因组位置,结核分枝杆菌H37Rv,羽裂分枝杆菌MP1,羽裂分枝杆菌MP2,羽裂分枝杆菌G01222,品尼小米G01491,品尼小米G01492,品尼小米G01498,品尼小米ATCCBAA688。颜色标度表示蛋白质的同一性。Contigs使用紫红色排序,并在Patric3。5。18网络资源中生成地图。
主要的功能注释是那些与能源生产和转换(11。95,19159)、脂质运输和代谢(9。43,15159)和细胞壁膜被膜生物发生(7。55,12159),这三个因素在结核分枝杆菌的致病性中起着重要作用。有趣的是,大多数检测到的SNPs是非同义的(86。72,98113),这意味着相关的CDSs在蛋白质序列变化的选择压力下,有可能促进功能多样性。
当使用STRING时,我们发现VapBC蛋白家族的特定成员之间有很强的蛋白质相互作用,其中具有串检测关系的多个蛋白质中有着非同义的SNP,这一事实也表明,尤其是这些Vap基因,正处于进化的压力之下。结核分枝杆菌,VapBC家族占毒素抗毒素系统的一半以上(4788个假定的毒素抗毒素系统)而含有VapBC的基因组区域与毒力和致病因子密切相关。
所鉴定的CDS是与mRNA翻译调控相关的型TA系统的一部分。更具体地说,VapC25和VapC29是一种核糖核酸酶,可以抑制M。斑点诱导后的细胞生长(即有抑菌作用)。两者合计,这些结果表明,MP1和MP2可能有不同的生存能力。
二、M。pinnipedii海狮的双重感染报告浅析
由于M。pinnipedii海狮通常生活在密集的群落中,它们非常容易受到由动物间直接接触传播的传染病的流行病的影响。引起的重叠感染M。结核分枝杆菌通常在高流行国家报告,在这些国家,人们暴露于多种菌株的M。结核分枝杆菌在他们的一生中,艾滋病病毒在决定发病率方面起着重要的作用。
通过跟踪一个平行线,有可能M。pinnipedii在海狮的种群中高度流行,以不同的循环毒株为代表,这可能对这一物种的保护产生前所未有的影响。不利的环境条件、营养不足和由于干扰或竞争而造成的慢性压力可能会抑制免疫系统,因此,羽足类动物可能容易患上由多种病原体引起的疾病。
在巴西,海狮搁浅通常是因为它们在迁徙期间长途跋涉时,它们的健康受到损害,在抵达海岸时身体虚弱,经常被大量细菌感染,这是最常见的导致死亡的因素。
在德国海德堡动物园和法国勒帕尔动物园饲养的野生或圈养出生的南美海狮中也曾描述过该病的爆发。再加上这份重复感染的报告,因此很明显,M。pinnipedii在南美海狮的野生种群中流行,并且正在被引入动物园,因此迫切需要评估南半球自由分布的羽足类动物中结核病的程度。
三、同源蛋白簇科氏菌皮脚真菌菌株
基于核心蛋白质簇功能的同源群聚类(COG)分类M。pinnipedii菌株,未知函数类(S)的COG分类。蛋白质聚类进行使用OrthoMCL作为可用的KBase平台,组类之间共享的同源蛋白质的数量是2到43个蛋白质。
没有蛋白质簇(即2个蛋白质的组)对每一个M。pinnipedii应变中的一种。然而,许多没有被归类到任何蛋白质簇的单个蛋白质被认为是每个蛋白质簇的唯一的。
在考虑非核心蛋白质簇(n292)两人至六人共用M。pinnipedii菌株,得到了类似的结果,与所有功能的CDSs被确定为假基因或不存在的PGAP的基础上,和未知数量的可能的假设和PEPPE基因可能存在于M。pinnipedii菌株。
综上所述,我们的研究结果表明,所分析的M。pinnipedii菌株呈现高水平的蛋白质组保守性,这与最近的泛基因组分析M。结核分枝杆菌在辅助基因组中至少检测到1122个CDSs,在36个基因组中检测到964个菌株特异性CDSs。然而,在该研究中的结核分枝杆菌泛基因组也用RAST进行了分析,没有考虑假基因。
四、羽状芽胞杆菌具有独特的缺失标记
在大序列多态性(LSP)分析中,8个先前描述的缺失(RD2seal,MiD3,MiD4,RD3,RD7,RD8,RD9,RD10)被发现在M。pinnipedii株。虽然古人类的基因组覆盖率M。pinnipedii读到关于M。结核分枝杆菌H37Rv在31。9447。83(质量修剪后)之间变化,MiD3和MiD4缺失在古株中未发现。
M。pinnipedii,而目前在同一物种的8个分析的现代菌株。这一发现有助于理解M。pinnipedii随着时间的推移,表明基因组减少的一个活跃的过程发生在过去一千年。
大序列多态性(LSP)科氏菌皮脚真菌菌株。值表示跨越每个缺失区域的核苷酸数。开始和结束:核苷酸位置根据结核分枝杆菌H37Rv参考基因组根据参考基因组对基因进行注释。
我们还检测到19个具有模糊读取映射的区域(即由非特异性匹配的映射读取组成的低测序覆盖率区域),范围从548bp到5329bp与至少一个PEPPE基因,而其余三个区域包括一个假设的蛋白质与氧化还原酶(Rv3530cRv3531c)和两个转座酶(Rv0797和Rv3023c)。
PEPPE基因家族对应于约10的编码能力的M。结核分枝杆菌基因组34在MTBC的各成员之间以及同一物种的菌株之间表现出高度的变异。
pinnipedii感染是南美海狮自由种群的地方病。这些菌株之间的遗传差异被发现与细菌细胞内维持和膜形成所必需的毒力因子和酶有关。这些现象对疾病的结果和动物物种的保护的实际影响以及潜在的种群水平的影响是未知的。
五、羽状芽胞杆菌分离株的测序。
根据制造商的指示,使用TruSeqdna无PCR样品准备试剂盒构建成对端基因组文库。用HiSeq2500和Illuminav3化学对基因组文库(100bp)进行测序。这些程序在巴西坎皮纳斯坎皮纳斯州立大学生命科学高性能技术中心实验室进行。以SRR7693584和SRR7693090为登录号,在SRA、NCBI中保存了Illumina序列读物。
首先使用Trimmomatic软件版本0。36通过质量和适配器的存在过滤来自每个文库的100bp成对末端读取。科氏菌皮脚真菌MP1和MP2基因组是使用SPAdes软件3。13。0版重新组装的。基因鉴定和注释由NCBI的PGAP和以GCA003027795。2(MP1)和GCA003027895。2(MP2)保存的草图基因组自动进行。
凤眼莲基因组圆图。为了形象化的预测蛋白质之间的相似性不同M。pinnipedii菌株,G01222,G01491,G01492和G01498的基因组组装使用CLC基因组工作台11和SPAdes软件版本3。13。0。
根据重叠群和N50的数量选出了最佳组合。组装好的重叠群用RAST2。0版注释,来自菌株G01222、G01491、G01492和G01498的重叠群和来自M。pinnipedii将保存在GenBank中的菌株MP1、MP2和ATCCBanroCorporation688用紫红色usingM。
结核病H37Rv(基因库NC000962。3)作为参考基因组。随后,利用Patric3。5。18网络资源中实现的蛋白质组比较方法构建了一个基因组图谱。六、羽状分枝杆菌同源和同源蛋白质簇群
为了鉴定同源基因组,七个M。pinnipedii使用的菌株。这M。pinnipedii菌株G01498、G01492、G01491和G01222在GenBank中没有组装好的基因组,这就排除了PGAP注释。
为了避免由于来自不同差异而导致的正交聚类的偏差,我们使用RAST版,排除预测的CDS150bp。然后用OrthoMCL对蛋白质进行聚类分析可从KBase平台获得。
简而言之,使用全能BLASTp算法发现了E值1e5的同源序列对。OrthoMCL然后将BLASTp结果转换成归一化的相似性矩阵,利用spanstylefontsize:1。059em;马尔可夫聚类算法span(MCL)对同源序列进行聚类分析。通货膨胀指数为1。5用于调节群集的紧密性。
由于RAST算法报告假基因和位于重叠群末端的断裂基因为真基因,因此菌株特异性CDSs的数量可能被高估。这一高估是使用BLASTp手动检查的。电讯盈科将获得的结果与注释进行比较羽状分枝杆菌MP1,MP2和ATCCBanro公司688,这些菌株存放在Genbank,并已用NCBI的PGAP注释。同源蛋白组用eggNOG分类使用基于图的无监督聚类算法扩展COG方法学。七、基因组大序列多态性
LSP检测与CLC基因组工作台11通过映射读取古代M。pinnipedii(样本54、58、64)和现代的M。pinnipedii株系(G01222、G01491、G01492、G01498、7739、7011、MP1、MP2)对M。结核分枝杆菌H37Rv。在根据参考基因组对古样本进行定位时,先对读图进行特殊处理,然后再作图。
读取是根据质量参数0。05基调用错误概率和的两个或两个以上歧义核苷酸在末端使用修正莫特修剪算法。读取是通过两种方式映射到参考基因组上的:排除或不排除非特定匹配。当一个读对齐在基因组的多个位置以同样好的分数排列时,就给出一个非特定的匹配。
将所得结果进行比较和对比,在这两种情况下,在查询基因组中被认为缺少小于10对齐读取或包含低映射质量读取的映射区域。MTBC的成员和11个M。pinnipedii以上描述的菌株被用来构建系统发育树。
简而言之,所有的读取集都被映射到引用结核分枝杆菌,而研究人员鉴定的H37Rv基因组和真正变异体,则需要排除位于重复区域的SNPs。参考文献:【1】BosKi,HarkinsKm,HerBigA,CoscolaM,WeberN,ComasI,等。哥伦布前的分枝杆菌基因组显示海豹是新世界人类结核病的来源。纳特;514:4947。
【2】KierA,KlarenbeekA,MendeltsB,VanSoolingenD,KoterG。在海洋哺乳动物动物园中传播品尼氏分枝杆菌。〔医〕结核性肺病。2008;12:146973。
【3】近亲DV,WilliamsSN,ReuterR,ForshawD,ChadwickB,CoughranD,等。野生海豹的结核和海豹芽孢杆菌的特征。AustVetJ。1993,70:927。
【4】BastidaR,LoureiroJ,QuseV,BernardelliA,RodrguezD,CostaE。结核病,来自阿根廷的野生Subantartarfur海豹。JWildl说。1999;35:7968。
【5】BernardelliBastidaAR,LoureiroJ,MichelisH,RomanoM,CataldiA,CostaE,等。来自西南大西洋海岸的海狮和毛皮海豹中的肺结核。科技牧师。1996;15:9851005。