微生物基因组研究进展

2022-09-12

微生物在自然界中可谓“无处不在”,涵盖了众多种类,广泛涉及医药、工农业、环保等诸多领域。目前随着医学研究进入分子水平,人们认识到遗传信息决定了生物体的生命特征,外部形态以及从事的生命活动等,生物体的基因组正是这些遗传信息的携带者。因此阐明生物体基因组携带的遗传信息,将揭示生命的起源和奥秘,而在分子水平上研究微生物病原体的变异规律、毒力和致病性,对于传统微生物学来说也是一场革命。

过去十年中,基因组计划已经使我们对微生物有更深的认识和理解,自从1 9 9 5年第一个微生物流感嗜血杆菌被测序以来,现在已经有将近3 0 0个原核生物已经被测序完成,而且大约还有7 5 0个物种正在进行全基因组测序。科学家在早期曾对2 0~3 0个代表性微生物的全基因组进行测序,测序结果反映出我们在微生物基因组学的早期阶段对物种间的序列差异知之甚少,证实了我们低估了微生物在遗传和生物进化上的差异。现在,基因组学集中在对同一物种间不同种类的测序提供了新的思维。

1 微生物全基因组测序策略

随机测序法又称为鸟枪法,是首先将一条完整的目标序列随机打断成小的片段,分别测序,然后利用这些小片段的重叠关系将它们拼接成一条序列。该方法早期主要用于较小微生物或细胞器基因组的测序,但是由于测序技术的限制,并且计算机不能把太多数目(几万)的随机片段拼接成一条序列,致使相对比较复杂的微生物全基因组测序进展缓慢。自从1989年Applied Biosystems公司推出的荧光自动测序仪和1990发展的Taq酶循环测序反应技术使原来的荧光标记双脱氧终止法在敏感的基础上具有了高通量、准确和经济的特性,同时由于计算机计算方法的发展使拼接几十万个300-500bp长的c DNA序列片段成为可能,所有这些条件的成熟使Fleischmann等人产生了用鸟枪法策略来测定几兆大小的比较复杂微生物全基因组的大胆构想,并付诸实施,采用全基因组随机测序法对流感嗜血杆菌全基因组序列进行测定获得成功,此后该法被广泛应用,几乎成为微生物全基因组测序的标准方法。

基于鸟枪法的全基因组测序策略主要2种:以克隆为基础的鸟枪法测序和全基因组鸟枪测序法。以克隆为基础的鸟枪法测序是构建微生物基因组物理图谱和随机测序相结合的方法,首先构建微生物的随机B A C文库,文库覆盖整个基因组,从中挑选出一组重叠效率较高的克隆群,再对每一个选定的克隆进行鸟枪法测序。这种方法在对基因组较大的物种进行测序有优势,因为每个克隆的测定序列在克隆内独立组装,这样计算机的拼接和缺口填充都相对简单的多;同时可以在不同的实验室之间开展合作。全基因组鸟枪测序法是直接将全基因组随机打断成小片段D N A,构建质粒文库,然后对质粒两端进行随机测序[1]。这种方法的优点是省去了复杂的物理图谱构建这一限制基因组测序进程的步骤,简化了整个基因组的过程,该法已被普遍应用。

2 微生物基因组研究的现状

鉴于微生物在多领域发展中具有重要价值,因此许多国家纷纷制订了微生物基因组研究计划。一些国家首先对人类重要病原微生物进行了大规模的序列测定,另外,还对有益于能源生产、改善环境以及工业加工的细菌开展了基因组序列测定工作。目前,微生物基因组研究的主要内容有以下几个方面。

2.1 模式微生物研究

在开展人类基因组计划的同时,模式生物基因组计划也同样在进行,其目的在于利用模式生物基因组与人类基因组之间编码顺序和组织结构上的同源性,用单一或简单的生物模式阐明高等生物特别是人的基因在结构、功能以及物种进化上的内在联系。

2.2 最小基因组研究

随着许多生物体全基因组测序的完成,兴起了最小基因组的研究,即一个能营独立生活的生物体最少需要多少个基因。目前研究最小基因组的手段主要是插入基因突变和同源重组删除基因分析。Mushegian等用软件充分比较了生殖道支原体和流感嗜血杆菌的编码蛋白基因,认为2 5 6个基因可以组成细胞独立生存所必须的最小基因组;I t a y a等用一个有选择标志的转座子随机插入到枯草杆菌基因组中,结果显示最小基因组约含3 0 0~5 0 0个基因;Hutchison等对二种支原体(生殖道支原体和肺炎支原体)进行系统性转座子插入突变实验,发现最小基因组所含的基因在265-300之间[2~3]。最小基因组的研究有助于揭示生命的起源、生物进化和生物代谢调控,使人类真正成为生命的主宰。

2.3 病原微生物基因组研究

病原微生物一直都是微生物研究的重点,目前病原微生物基因组研究的重点主要集中在以下几个方面:在深化认识微生物之间关系的基础上寻找对付感染的新措施;利用微生物基因组寻找新的药物作用靶位,利用比较基因组技术对抗微生物药物进行靶向设计;寻找新的诊断试剂和诊断标记;研制新的疫苗。以微生物基因组为平台,应用生物信息学技术预测毒力因子、分泌及表面相关抗原,应用蛋白质组学技术寻找外膜抗原,应用体内表达技术、信号标签诱变技术、DNA芯片等寻找侵袭及毒力相关抗原。对上述抗原基因进行高通量克隆、表达,纯化重组蛋白。然后,再对纯化后的抗原进行体内、体外评价,筛选出保护性抗原,进行疫苗研究[4]。

2.4 生物信息学研究

生物信息学是用数理和信息科学的观点、理论和方法,通过处理和分析呈指数增长的生物学数据,来研究生命现象的一门新兴学科。它主要由数据库、计算机网络和应用软件组成。随着各种微生物基因组研究的相继开展,序列测定技术日益向工业化发展,相应的生物技术手段得到广泛的应用,生物学实验数据呈爆炸趋势增长,因而借助于数学和计算机手段对高通量生物学数据进行处理显得尤为重要;另一方面,计算机信息技术和国际互联网的发展也使得大型数据的收集、存储、处理和分析成为可能,生物信息学因此得以迅速发展,并且日益显现出强大的生命力。目前生物信息学对微生物基因组的主要研究内容是高通量的注释微生物基因组的所有编码产物的生物学功能。

2.5 比较基因组学研究

比较基因组学是随着微生物基因组数据的增多而发展起来的,其最初目的是通过模式生物和人类基因组的比较阐明高等生物特别是人的基因在结构、功能以及物种进化上的内在联系。通过基因组的比较,人们发现许多病原微生物的毒力基因集中在一段独特的D N A片段上,这种片段称为“致病岛(pathogenicty island,PAI)”,研究表明P A I主要分布在可移动的遗传元件上,如转座子、质粒或噬菌体上。以后的研究表明多种重要的病原微生物,如致病性大肠杆菌、鼠疫杆菌、伤寒杆菌、幽门螺杆菌和霍乱弧菌等都存在不同特征的致病岛结构。通过基因组比较人们提出了“基因组岛(genomic islands,GI)”的概念,是指当七个或多个亲缘关系较近的物种进行全基因组序列比较时所产生的、各基因组所特有的D N A片段,如与分泌有关的“分泌岛”、与抗生素耐药性有关的“抗性岛”、与生理代谢有关的“代谢岛”等。

3 微生物基因组计划的深远影响

对一个基因组,单纯测序工作的完成,还仅仅是解决了从字母到字母的排序问题,得到的仅仅是一部由A,T,G,C四个字母组成的没有“词”、“词组”、“句子”的“天书”。要读懂这部天书就必须对“天书”进行注释,即要解读基因组序列中各功能元件的意义。对一个细菌基因组的完全注释,即读懂“全文”,决不是一代人所能完成的工作,这将是“后基因组时代”的艰巨任务。

目前,大部分常见医学微生物都已有代表株完成测序或正在被测序之中。尽管目前对已完成测序的微生物基因组都还只是“部分注释”,但所获得的信息已经使得微生物学专业工作者应接不暇。这些信息正在全面更新微生物学的现有知识,对微生物学乃至整个生命科学产生着极为深远的影响。在微生物基因组完成测序和注释之后,人们对该微生物的每一个基本生物学特性、致病性、免疫性等重要问题的理解将更全面、更精细和更准确。从目前已经完成测序的为数有限的微生物基因组学研究来看,已经向人们展示了大量前所未知的全新事实:如发现了某些细菌其实不止一个染色体,嗜盐古细菌sp.NRC21基因组有一个大染色体和两个小染色体(Mini2chromosome);霍乱弧菌含有2条环状染色体,较大的染色体含2 9 6 1 1 4 6 b p G+C含量为46.9%,较小染色体含1072314bp,G+C含量为47.7%;细菌基因组携带前噬菌体基因组是一种普遍现象,其携带率达百分九十几,有的甚至高达100%,这些溶原性前噬菌体在不同细菌之间的转移形成了一种“基因流”,这种基因流在细菌致病性、耐药性的传递中具有重要意义;细菌基因组大约9 0%左右的序列都是编码序列,相比之下,人类基因组的编码序列只占3%~5%,可以看出原核生物对碱基序列的使用是高利用率的,这反映出细菌遗传序列的“储备量”(即未利用序列)较人类少得多[5];麻风杆菌基因组研究揭示,该菌与结核杆菌有共同的祖先,在进化的长河中,麻风杆菌发生了退化,产生了众多假基因,推定有4.4 M b的结核杆菌基因组编码了约4000种蛋白,按比例计算,3.3Mb的麻风杆菌基因组应编码约3 0 0 0种蛋白。仅此几例,足可以说明微生物基因组研究正在向我们揭示着崭新画面。

基因组时代一个不容置疑的事实是来自微生物测序而产生的实验数据将会继续积累,海量的数据就像一部“天书”一样摆在人们的面前,通过对这部“孕含生命密码”的天书的解读,必将对人类认识生命的起源、认识自我产生巨大影响,同时微生物基因组的研究也必将给药物开发、疫苗研制、新的诊断标记的寻找带来不竭的动力。

摘要:本文阐述了微生物基因组的测序方法,并探讨了微生物基因组的研究现状,最后展望了微生物基因组的发展前景。

关键词:微生物,基因组,进展

参考文献

[1] Fong,S.S.,Burgard,A.P.,Herring,C.D.,Knight,E.M.,Blattner,F.R.,Maranas,C.D.,and Palsson,B..2005.In silico design and adaptive evo-lution of Escherichia coli for produc-tion of lactic acid.Biotechnol.Bioeng.91:643~648.

[2] Hoffmaster,A.R.,Ravel,J.,Rasko,D.A.,Chapman,G.D.,Chute,M.D.Marston,C.K.,De,B.K.,Sacchi,C.T.,Fitzgerald,C.,Mayer,L.W.et al.2004.Identification of anthrax toxingenes in a Bacillus cereus associatedwith an illness resembling inhalationanthrax.Proc.Natl.Acad.Sci.101:8449~8454.

[3] Hou,B.K.,Ellis,L.B.,and Wackett,L.P.2004.Encoding microbial meta-bolic logic:Predicting biodegradation.J.Ind.Microbiol.Biotechnol.31:261~272.

[4] Tyson,G.W.and Banfield,J.F.2005.Cultivating the uncultivated:A com-munity genomics perspective.TrendsMicrobiol.13:411~415.

[5] Lee,S.Y.,Lee,D.-Y.,and Kim,T.Y.2005.Systems biotechnology for strainimprovement.Trends Biotechnol.23:349~358.

上一篇:新课程下中学政治课教学的创新下一篇:探索动画角色创作与场景设计的关系