结构基因

2024-05-15

结构基因(精选十篇)

结构基因 篇1

1 水稻株高性状相关基因

株高作为水稻株型改良中的一项重要性状, 与生物产量呈线性相关。株高过高, 生物产量高, 植株易倒伏、易染病, 从而导致作物经济产量降低。而矮秆、半矮秆品种株高较低, 植株抗倒伏, 同时对病原菌侵袭的抵抗能力增强, 秸秆的生物学产量降低, 作物籽粒产量提高。

随着现代分子生物技术发展以及水稻矮秆突变体的不断获得和研究, 关于水稻株高调控基因的报道也越来越多。而绝大多数都主要与赤霉素 (GA) 的遗传和调控有关。赤霉素作为四环双萜植物激素, 主要影响植株茎的伸长。玉米的Dwarf8 (D8) 、大麦的Slenderl (SLN1) 、小麦的Reduced height1 (RHT1) , 以及拟南芥的GA insensitive (GAI) 和repressor of gal-3 (RGA) 基因均为GA生物合成途径中的一个负调控因子[4,5,6,7]。水稻中矮秆隐性突变体semidwar (SD1) 基因中SD1编码的GA 20-oxidase, 是GA生物合成途径中的一种重要的限速酶[8]。迄今为止在水稻中共发现4个GA 20-oxidase基因, 分别为OsGA20ox1、OsGA20ox2、OsGA20ox3和OsGA20ox4, 这4个基因在繁殖器官中都表达, 而只有OsGA20ox2和OsGA20ox4在营养器官中表达[9]。水稻矮秆突变体Slenderl rice1 (SLR1) 基因为隐性基因, 对组成型的GA敏感[10]。研究发现, 水稻中有2个对GA不敏感矮秆突变基因GID1和GID2。其中GID1作为GA的接收器, 通过与GA结合促进GID1与SLR1相互作用, 从而使SLR1退化。而GID2则作为一个正向调控因子诱导SLR1退化[11,12]。在GA合成途径中, OsGA2ox1编码的GA2-oxidase是GA的分解酶, 通过对OsGA2ox1基因的过表达减少GA含量, 从而达到降低株高的目的[13]。而GA3-oxidase作为GA生物合成途径最后一步的酶, 基因OsGA3ox1和OsGA3ox2分别在繁殖器官和营养器官中特异表达[14]。

2 水稻分蘖性状相关基因

水稻分蘖的多少直接影响着水稻产量的高低。研究水稻分蘖主要从分蘖数和分蘖角2方面展开。

2003年Nature杂志上报道了1个控制分蘖数量的基因MOC1, 该基因是在水稻单秆突变体moc1中通过图位克隆的方法分离得到的[15]。MOC1为隐性基因, 其突变体丧失分蘖能力, 仅有1个主茎。MOC1基因编码植物所特有的GRAS基因转录因子家族, 是1个正向调控因子, 控制着水稻腋芽分生和分蘖的形成, 同时能够促进分蘖芽的生长。另一个控制水稻分蘖的基因OsTB1, 是1个负向调控因子, 在水稻腋芽处表达, 该基因如过量表达, 则水稻分蘖数明显减少, 水稻fine culm1 (fc1) 突变体表现出类似现象。该突变体缺失OsTB1基因, 表现为分蘖数显著增加[16]。

另一方面, 在水稻株型育种研究中, 水稻分蘖角度是否适中直接影响着水稻种植群体的合理性。目前研究比较深入的是LA1基因, 该基因是自水稻散生突变体lazy1第1个图位克隆得到的控制水稻分蘖角度的基因。研究表明, LA1作为负调控因子, 通过编码包含1个跨膜结构域和1个载体结构域的蛋白质, 负向调控植物生长素极性运输。LA1基因通常在胚芽鞘部位表达水平最高, 在根中有微量的表达, 表现为重力敏感型表达。LA1的功能丧失性突变体极性运输增强, 改变内源生长激素在芽中的分布, 从而使得水稻分蘖夹角增大, 表明LA1蛋白与重力性呈负相关[17,18,19]。此外, 有研究表明水稻基因OsLIC通过编码结构蛋白来负向调控水稻分蘖的叶夹角, 抑制OsLIC的表达, 叶和分蘖的夹角显著增大[20]。Tiller Angle Controlling (TAC1) 和PROS-TRATE GROWTH1 (PROG1) 是两个比较重要的控制水稻分蘖角度的基因。TAC1基因是通过图位克隆得到的, 位于水稻第9染色体, 由于其第4内含子上3′位点的1处碱基发生置换, 使得基因发生突变, 表现出功能差异, 研究表明, TAC1基因正向调控水稻分蘖角度的大小[21]。PROG是控制野生稻匍匐生长习性的基因, 该基因主要在腋芽的分生组织处表达[22]。

3 水稻穗部性状相关基因

水稻穗部性状是水稻重要的形态特征之一, 穗部性状影响着水稻的群体结构及产量。穗部性状主要包括穗型、穗长、穗弯曲度、每穗粒数、着粒密度、枝梗数与形态等, 而研究穗部性状主要是从穗型分类、穗部结构与产量和品质的关系以及通过分子生物学手段对穗型相关基因的分离和克隆及功能等方面逐步展开的。

在穗型基因的研究中, 主要从散穗基因和直立穗基因两方面进行的。目前只有4个基因位点被发现, 分别是隐性基因Spr1, 显性基因Spr2、Spr3 (t) 和Spr4 (t) , 这些基因目前还没有被分离和克隆[23,24,25,26]。在粳稻品种 (Hwacheong) 突变体中通过图位克隆方法得到了DEP3基因, 其位于水稻第6染色体上, 是一对单隐性基因。DEP3基因在突变体中由于片段缺失导致突变体全生育期表现为直立穗型, 但对其它性状没有影响[27]。另一个隐性突变基因EP3同样为直立穗型控制基因, 位于水稻第2染色体上, 含有该基因的突变体表现为穗轴粗度和小维管束的数量都有明显增加, 从而导致穗型直立。同时, 突变体中的一次枝梗数和籽粒数增加, 也导致产量明显增加[28]。而qPE9-1则是一个位于水稻第9染色体上的控制水稻直立穗表型的主效QTL, 该基因导致穗下垂, 而qPE9-1作为功能丧失性突变则引起穗直立, 且对穗长、粒长和粒重等性状也有一定的调控作用[29]。

此外, 水稻穗部性状与产量的基因也相继被分离和克隆出来。DEP1作为控制水稻密穗直立及每穗粒数的多效基因, 位于第9染色体上。该基因编码的蛋白质, 与磷脂酰乙醇胺结合蛋白有类似功能域[30]。经过突变, DEP1能够促进细胞分裂, 从而达到矮化植株高度、增加稻穗、枝梗数和每穗籽粒数。而在水稻第7染色体上发现的Ghd7基因, 是第1个克隆得到的一因多效的基因, 该基因不但控制水稻株高性状, 同时还控制水稻抽穗期和每穗粒数等性状[31]。同时, 一些粒形相关基因也被发现克隆, 如GS3、GW2、GW5等[32,33,34]。另有关于水稻穗部枝梗着生密度突变体及其相关基因的研究报道, 如水稻枝梗无小穗突变体Branched floretless (bfl1) , 含有BFL1基因, bfl1突变体的穗部枝梗不伸展, 不产生小花, 只长出下一级枝梗, 而BFL1基因位于第7染色体, 控制水稻的花分生组织的发育[35]。有关研究还报道过水稻簇生穗突变体Clustered spikelets (Cl) 及相关基因C1[36], 水稻稀穗突变体Lax panicle (lax) 及相关基因LAX[37], 水稻小穗分化调控基因突变体Frizzy panicle (fzp) 以及其基因FZP。FZP基因作为一个转录因子, 能够转录激活一个类似乙烯应答ERF的结构域, 从而阻止腋芽分生组织形成, 决定水稻小穗的发育[38]。

4 结论

株型结构对水稻产量有着重要的影响。水稻高产株型模式主要有5种:Khush博士的“少蘖、大穗模式”[3], 杨守仁等的“理想株型”及“直立穗型”[39], 袁隆平院士的“超高产杂交稻的理想株型”模式[40], 黄耀祥院士的“半矮秆丛生旱长超高产株型模式”[41]以及周开达的“重穗型”模式[42]。

目前水稻株型的各个性状, 从株高、分蘖、穗长、穗重、一次枝梗、二次枝梗、穗粒数和粒重等方面都有着相关的研究报道。随着越来越多的水稻株型结构相关基因被标记定位和克隆, 水稻株型的理论研究也越来越深入, 也为育种工作提供更直接的理论指导和技术支持。控制植物性状的基因分为主效基因和微效多基因, 大部分性状属于数量性状, 受到多个基因和外界环境条件共同调节。所以, 改良某个主效基因很难改变植株性状。就株型结构相关性状受1个或多个基因共同调控, 是一个复杂的基因调控网络。育种时, 通过有利基因不断地聚合或累加, 同时综合其它性状的表现, 改善株型, 提高作物产量。

另外, 突变体是基因研究中的重要材料, 通过自然变异和物理化学等方法诱变, 获得水稻株型相关性状的突变体, 为水稻株型结构的遗传、分子机理以及育种工作研究提供了基础。如从高氮吸收和利用率的植物材料中分离克隆氮代谢相关基因, 从灌浆效率高的植物材料中分离相关基因。因此, 加强种质资源的搜集整理工作, 建立丰富的种质资源库, 从中筛选产量高的突变材料, 研究其株型结构与产量间的关系, 从而能够更快更准确地分离出相关目标基因。

摘要:为加强水稻分子育种研究并提高其产量, 综述了水稻株型结构即株高、分蘖数、分蘖角度和穗部性状相关基因的研究进展, 并通过基因工程方法对株型育种工作进行了展望。

结构基因的名词解释 篇2

结构基因是编码蛋白质或RNA 的基因。细菌的结构基因一般成簇排列,多个结构基因受单一启动子共同控制,使整套基因或都表达或者都不表达。结构基因编码大量功能各异的蛋白质,其中有组成细胞和组织器官基本成分的结构蛋白、有催化活性的酶和各种调节蛋白等。

结构基因的简介

结构基因是一类编码蛋白质或RNA的基因.

在大肠杆菌乳糖代谢的基因调节系统中有3个连锁在一起的结构基因:

LacZ基因:决定β-半乳糖苷酶的形成.而β-半乳糖苷酶将乳糖水解成葡萄糖和半乳糖,作为细菌代谢活动的碳源。

LacY基因:决定β-半乳糖苷透性酶的合成。该酶的作用是使乳糖易于进入E.coli的细胞中。

LacA基因:编码β-半乳糖苷乙酰基转移酶,此酶的功能尚不清楚。

这3个结构基因具有两方面的特征:1.它们彼此紧密连锁。按Z,Y,A顺序排列,而且在一起转录形成一个多顺反子的mRNA;2.只有当乳糖存在时,这些基因才迅速转录,形成多顺反子的mRNA,并翻译成相应的酶.所以这些酶,就是由乳糖诱导产生的诱导酶,其活性的产生和活性的提高不是已有的酶被激活所致,而是在诱导物的诱导下酶的重新合成,并随着合成的进行,酶的浓度迅速增加的结果。

结构基因的分类

这三者是对基因的功能所作的区分,是以直线形式排列在染色体上。

结构基因:是决定合成某一种蛋白质或RNA分子结构相应的一段DNA。结构基因的功能是把携带的遗传信息转录给mRNA(信使核糖核酸),再以mRNA为模板合成具有特定氨基酸序列的蛋白质或RNA。

调节基因:是调节蛋白质合成的基因。它能使结构基因在需要某种酶时就合成某种酶,不需要时,则停止合成,它对不同染色体上的结构基因有调节作用。

操纵基因:位于结构基因的一端,是操纵结构基因的基因。当操纵基因“开动”时,处于同一染色体上的,由它所控制的结构基因就开始转录、翻译和合成蛋白质。当“关闭”时,结构基因就停止转录与、翻译。操纵基因与一系列受它操纵的结构基因合起来就形成一个操纵子。

结构基因的理论功能

结构基因 篇3

关键词: 梭梭;PrxQ基因;序列分析;蛋白结构

中图分类号: S718.43 文献标志码: A

文章编号:1002-1302(2015)08-0027-04

梭梭(Haloxylon ammodendron)为藜科(Chenopodiaceae)梭梭属(Haloxylon Bunge)多年生小乔木,别称琐琐、梭梭柴,属强旱生植物 [1],主要分布在我国新疆的准噶尔盆地、塔里木盆地,内蒙古阿拉善盟、巴彦淖尔盟,甘肃的河西走廊西端,青海柴达木地区荒漠地区,生长于海拔2 700~3 000 m的半荒漠、荒漠地区的沙地,为国家濒危三级保护植物 [2]。

柴达木盆地是我国土地盐碱化的主要发生地区之一,由于该地区气候高寒干燥,蒸发量大而降水量小,加上风蚀、沙化严重,使盆地存在着沙漠化、盐渍化的双重危害,严重制约着该区社会经济的可持续发展。作为柴达木盆地旱生、盐生荒漠植被组成的主体,梭梭是当地流动沙地治理的先锋树种,它不仅具有显著的生态价值,而且具有很重要的药用价值,因而对其研究和开发利用具有重要的生态、经济、社会价值。

盐胁迫导致的渗透胁迫和离子毒害使植物产生大量的活性氧(ROS),ROS浓度的提高会积累丙二醛(MDA)等有害过氧化物,造成膜脂过氧化,使ROS产生与清除之间的动态平衡被破坏,如果不能及时清除ROS就会造成氧化胁迫 [3]。为了防止活性氧对细胞造成伤害,植物细胞会启动针对活性氧的清除机制。盐胁迫下盐生植物抗氧化酶活性高于非盐生植物 [4],盐胁迫下植物体内抗氧化酶的活性上升可清除过多的活性氧,从而保护膜系统不受破坏并提高植物的耐盐性 [5-6]。

过氧化物还原酶是植物抗氧化过程中的一种酶,其分布广泛,几乎存在于所有植物、酵母、细菌、寄生虫、哺乳动物等多种生物体内,基于氨基酸序列中半胱氨酸残基的保守性及催化机制可将植物的过氧化物还原酶分为4种:1-Cys Prx、2-Cys Prx、Ⅱ型Prx、Ⅱ型PRxQ [7-8]。过氧化物还原酶在原核生物、真核生物中都高度保守 [9],它可以催化H2O2还原为水,或在供体氢的存在下,催化各种烷基过氧化物还原为水和相应的醇,通过调节细胞内H2O2浓度参与信号传导 [10]。Kong等首先从佛甲草中克隆到PrxQ [11],目前已在四翅滨藜、拟南芥、梭梭(内蒙古阿左旗巴丹吉林沙漠)、小麦等植物中获得了PrxQ基因 [12-15]。甘晓燕等对内蒙古巴丹吉林沙漠梭梭的PrxQ基因进行了克隆和分析 [14]。由于不同生境下的植物基因具有变异性,本研究在对柴达木盆地梭梭进行PrxQ基因克隆的基础上,对PrxQ基因的核苷酸序列、氨基酸序列进行分析,在此基础上对PrxQ基因蛋白的亚细胞定位、二级结构、三级结构、功能位点及跨膜区进行了预测,以期为下一步PrxQ基因的表达特性研究奠定基础。

1 材料与方法

1.1 试验材料

1.1.1 植物材料 供试梭梭的种子采自青海省柴达木盆地;供试土壤为园土,按1 ∶ 2的比例加入泥炭。2013年9月中旬采集梭梭的种子,经消毒后播种到30 cm(高)×25 cm(内径)的花盆中,待梭梭苗木长到10 cm左右时采集位于中上部的绿色同化枝进行总RNA的提取。

1.1.2 主要试剂 Ex Taq DNA聚合酶、反转录酶、DL2000 DNA marker,购自宝生物工程(大连)有限公司;植物RNA提取试剂盒,购自北京艾德莱生物科技有限公司。

1.2 试验方法

1.2.1 引物设计与合成 根据已发表的PrXQ基因序列设计引物,由大连宝生物工程有限公司合成,预期目的片段长度为657 bp。引物序列为:PrXQ-F:5′-ATGGCTACCCTCTCACTT-3′;PrXQ-R:5′-TCAAAGGCTTTGTAGAAATT-3′。

1.2.2 梭梭总RNA的提取 参照试剂盒说明提取梭梭总RNA。

1.2.3 RT-PCR 取5 μL提取的梭梭总RNA、4 μL下游引物、3 μL dNTP Mixture、3 μL RNase-Free ddH2O,70 ℃预热 5 min,立即冰浴2 min;再分别加入4 μL 5倍的反转录缓冲液、1 μL反转录酶,置于42 ℃水浴50 min,95 ℃ 5 min;补加RNase-Free ddH2O至总体积为50 μL。将得到的cDNA于-20 ℃保存。

1.2.4 PCR扩增 取2 μL上述反转录产物、5 μL 10倍的PCR缓冲液、3 μL MgCl2、4 μL dNTP、各2 μL上下游引物、05 μL Taq DNA聚合酶,加RNase-Free ddH2O至50 μL后进行扩增。PCR扩增的程序为:94 ℃预变性5 min;94 ℃变性1 min,52 ℃退火1 min,72 ℃ 延伸1 min,共35个循环;72 ℃延伸10 min。

1.2.5 序列测定与分析 将扩增正确的PCR产物送交生物公司进行序列测定,应用DNAStar对PrxQ基因序列进行分析,并预测PrxQ蛋白的二级结构和亲水性。用SignalP4.1进行蛋白信号肽分析,TMHMM进行蛋白跨膜螺旋区分析,PredictProtein 进行蛋白细胞定位及蛋白修饰位点分析,应用 I-TASSER 在线服务器预测蛋白的三级结构。

nlc202309042035

2 结果与分析

2.1 梭梭总RNA提取

由图1提取的梭梭总RNA经1%琼脂糖凝胶电泳的检测结果看出,RNA所在泳道目的条带清晰,28S亮度为18S的2倍,提取的总RNA可以满足后续试验的要求。

2.2 梭梭PrxQ基因PCR扩增结果

将PrxQ基因的PCR扩增产物进行1%琼脂糖凝胶电泳,图2结果表明,PrxQ基因所在泳道出现目的条带,大小与预期的657 bp长度相符。

2.3 PrxQ基因核苷酸序列和氨基酸序列分析

2.3.1 核苷酸序列分析 测定的PrxQ基因核苷酸序列经DNASTAR软件分析,表1结果表明:PrxQ基因核苷酸序列长度为657 bp,T的含量较高,达到30.59%;整个基因序列中 A+T 的含量高于G+C的含量。

2.3.2 氨基酸序列分析 推导的PrxQ基因氨基酸序列经DNASTAR软件进行分析表明,氨基酸序列长度为218个,相对分子质量为23 977.06 u,等电点为9.317。根据表2数据计算各类氨基酸中碱性、酸性氨基酸的数量比例分别为151%、8.3%,疏水性、亲水性氨基酸的数量比例分别为353%、41.3%。

2.3.3 柴达木盆地梭梭PrxQ基因与参考基因核苷酸序列、氨基酸序列的比较结果 将获得的柴达木盆地梭梭PrxQ基因与GenBank中登录的内蒙古巴丹吉林沙漠梭梭(JN657416.1)、胶杨(Populus balsamifera,AY530803.1)、盐角草 (Salicornia herbacea,FJ443123.1)、佛甲草(Sedum lineare,AB037598.1)、盐地碱蓬(Suaeda salsa,AY373447.1)、冬小麦(Triticum aestivum,JQ739147.1)、团藻(Volvox carteri,XM_002954776.1)等植物的PrxQ基因核苷酸序列、氨基酸序列进行比较。表3结果表明,所得梭梭PrxQ基因序列与非梭梭属植物PrxQ基因序列间存在着丰富的变异,其核苷酸序列的同源性在40.5%~86.8%间,氨基酸序列同源性在 33.6%~89.3% [JP+1]间,与已登录的梭梭PrxQ基因核苷酸序列同源性为98.8%,氨基酸序列同源性为97.7%,有一定的突变发生,可见不同来源梭梭的PrxQ基因存在着丰富的变异。

2.4.2 PrxQ蛋白二级结构预测 PredictProtein预测二级结构结果显示,梭梭PrxQ蛋白二级结构主要组成为:α螺旋,占20.18%;β折叠,占23.39%;无规则卷曲,占56.42%。可见无规则卷曲是梭梭PrxQ蛋白二级结构的主要构成元件。

利用SignalP4.1(http://www.cbs.dtu.dk/services/SignalP/)对PrxQ蛋白进行信号肽的预测,结果表明,PrxQ蛋白为非分泌蛋白,该蛋白不含信号肽。用TMHMM预测梭梭PrxQ基因跨膜区,结果显示PrxQ蛋白不含跨膜螺旋的结构。

利用PredictProtein对PrxQ进行功能位点预测,结果表明,PrXQ具有2个 N-糖基化位点,分别为8~11位的NHTL、31~34位的NISI,其糖基化的连接点均为天冬酰胺;7个蛋白激酶C磷酸化位点,分别为19~21位的TPK、59~61位的SPR、62~64位的SYK、81~83位的TLK、144~146位的SHK、147~149位的SFK、211~213位的TLK;2个酪蛋白激酶Ⅱ磷酸化位点,分别为81~84位的TLKD、138~141位的SGDD。

图4的亲水性预测结果显示,PrxQ蛋白的亲水性较强,分布区域较多,主要的分布区为17~30、37~41、49~64、81~ 90、94~97、106~115、117~130、139~154、159~172、181~189、198~210位。可见该蛋白亲水性较强,具有多个连续亲水区。

在蛋白质二级结构的基础上,采用I-TASSER在线软件对柴达木盆地梭梭PrxQ蛋白进行蛋白质三维结构的预测。由图5的预测结果可知:5个得分最高的PrxQ蛋白三维结构均主要由α螺旋、β折叠、无规则卷曲互相盘绕而成,其中模型1的C-score(表示预测模型的置信度)达到了-2.51,说明所建模型可信度较高。

3 结论与讨论

对于同一个物种而言,不同的生境使其具有不同的生物学特性,长期生长于高盐环境的植物往往具有比生长于低盐环境的植物更强的耐盐性 [16-17],柴达木盆地梭梭长期生长于盐碱地中,具有很强的耐盐性。前人对干旱区盐生植物的生理生化研究显示,相对于白梭梭、柽柳、胡杨、枸杞、柠条、扬柴、沙棘、沙枣等旱生植物,梭梭具有更强的耐盐性。除了在高盐环境中Na+的吸收、转运、区室化作用对梭梭的生存起着关键作用外 [18],抗氧化酶系统及时清除自由基也起着至关重要的作用。本研究通过对柴达木旱生、盐生植物梭梭的PrxQ基因的克隆、序列分析及结构预测,以期为阐明柴达木盆地梭

梭耐盐机制奠定基础。

本研究获得的柴达木盆地梭梭PrxQ基因总长657 bp,编码218个氨基酸,序列比对分析表明:柴达木盆地梭梭PrxQ基因核苷酸序列与不同科属植物PrxQ基因的同源性在405%~86.8%间,氨基酸序列同源性在33.6%~89.3%间;而与已发表的内蒙古巴丹吉林沙漠梭梭PrxQ基因的核苷酸序列存在一定的差异性,其同源性为98.8%,氨基酸序列同源性为97.7%。不同地域和自然环境的梭梭不仅存在着核苷酸序列上丰富的变异,其氨基酸序列也存在着丰富的变异,从而保证了梭梭在极端环境下能够正常生长发育。

此外通过在线分析软件预测可知,梭梭PrxQ蛋白定位于叶绿体中,且该蛋白不含信号肽,为非分泌蛋白,不含跨膜螺旋的结构,为非跨膜蛋白,且属亲水蛋白。二级结构预测显示,无规则卷曲为梭梭PrxQ蛋白二级结构的主要构成元件。功能位点预测显示,PrxQ具有2个 N-糖基化位点,说明柴达木盆地梭梭可能通过PrxQ蛋白的糖基化实现蛋白的翻译后调控,并参与细胞信号识别等生命过程 [19];另外含有7个蛋白激酶C磷酸化位点、2个酪蛋白激酶Ⅱ磷酸化位点,说明梭梭PrxQ蛋白可能通过磷酸化级联反应依次控制基因表达并进行细胞的信号传导。在蛋白质二级结构的基础上对柴达木盆地梭梭PrxQ蛋白进行蛋白质三维结构的预测并获得了其三维结构,主要由α螺旋、β折叠、无规则卷曲互相盘绕而成。

nlc202309042035

参考文献:

[1] 盛晋华,乔永祥,刘宏义,等. 梭梭根系的研究[J]. 草地学报,2004,12(2):91-94.

[2]邹 婷,李 彦,许 皓,等. 不同生境梭梭对降水变化的生理响应及形态调节[J]. 中国沙漠,2011,31(2):428-435.

[3]Rai M K,Kalia R K,Singh R,et al. Developing stress tolerant plants through in vitro selection-an overview of the recent progress[J]. Environmental and Experimental Botany,2011,71(1):89-98.

[4]Seckin B,Turkan I,Sekmen A H,et al. The role of antioxidant defense systems at differential salt tolerance of Hordeum marinum Huds. (sea barleygrass) and Hordeum vulgare L.(cultivated barley)[J]. Environmental and Experimental Botany,2010,69(1):76-85.

[5]Castelli S L,Grunberg K,Muoz N,et al. Oxidative damage and antioxidant defenses as potential indicators of salt-tolerant Cenchrus ciliaris L. genotypes[J]. Flora-Morphology,Distribution,Functional Ecology of Plants,2010,205(9):622-626.

[6]Lee S H,Ahsan N,Lee K W,et al. Simultaneous overexpression of both Cu Zn superoxide dismutase and ascorbate peroxidase in transgenic tall fescue plants confers increased tolerance to a wide range of abiotic stresses[J]. Journal of Plant Physiology,2007,164(12):1626-1638.

[7]Tripathi B N,Bhatt I,Dietz K J. Peroxiredoxins:a less studied component of hydrogen peroxide detoxification in photosynthetic organisms[J]. Protoplasma,2009,235(1/2/3/4):3-15.

[8]Dietz K J. Peroxiredoxins in plants and cyanobacteria[J]. Antioxidants & Redox Signaling,2011,15(4):1129-1159.

[9]Verdoucq L,Vignols F,Jacquot J P,et al. In vivo characterization of a thioredoxin h target protein defines a new peroxiredoxin family[J]. The Journal of Biological Chemistry,1999,274(28):19714-19722.

[10] 王 蔚,祁婷婷,刘 芸,等. 过氧化物氧还蛋白家族的功能及调节机制[J]. 生命的化学,2010,3(2):184-188.

[11]Kong W,Shiota S,Shi Y,et al. A novel peroxiredoxin of the plant Sedum lineare is a homologue of Escherichia coli bacterioferritin co-migratory protein (Bcp)[J]. The Biochemical Journal,2000,351(Pt 1):107-114.[HJ1.7mm]

[12]Bouchenak F,Henri P,Benrebiha F Z,et al. Differential responses to salinity of two Atriplex halimus populations in relation to organic solutes and antioxidant systems involving thiol reductases[J]. Journal of Plant Physiology,2012,169(15):1445-1453.

[13]Adén J,Wallgren M,Storm P,et al. Extraordinary μs-ms backbone dynamics in Arabidopsis thaliana peroxiredoxin Q[J]. Biochimica et Biophysica Acta,2011,84(12):1880-1890.

[14]甘晓燕,石 磊,周晓燕,等. 梭梭过氧还蛋白基因(PrxQ)克隆与序列分析[J]. 西北农业学报,2012,21(6):53-57.

[15]张 盈,牛祖彪,李 娜,等. 异附加系小麦过氧化物还原酶基因TaPrxQ的克隆与序列分析[J]. 分子植物育种,2012,10(3):285-289.

[16]Ahmad M S,Ashraf M,Ali Q. Soil salinity as a selection pressure is a key determinant for the evolution of salt tolerance in blue panicgrass (Panicum antidotale Retz.)[J]. Flora,2010,205(1):37-45.

[17]Long X H,Huang Z R,Huang Y L,et al. Response of two jerusalem artichoke (Helianthus tuberosus) cultivars differing in tolerance to salt treatment[J]. Pedosphere,2010,20(4):515-524.

[18]Jampeetong A,Brix H. Effects of NaCl salinity on growth,morphology,photosynthesis and proline accumulation of Salvinia natans[J]. Aquatic Botany,2009,91(3):181-186.

[19]Helenius A,Aebi M. Intracellular functions of N-linked glycans[J]. Science,2001,291(5512):2364-2369.

结构基因 篇4

1 Nanog的发现及其结构

通常来说, 胚胎干细胞体外维持全能性需要在白血病抑制因子 (LIF) 与血清或骨形态发生蛋白4 (BMP4) 存在的条件下, 通过3个核心小基因 (Sox2、Oct4、Nanog) 转录调控网络的相互作用来进行[3]。研究表明, Oct4与Sox2相互结合以阻止分化来促进胚胎干细胞的自我更新[4]。而且, Oct4水平对胚胎干细胞的状态亦有影响, 如缺少Oct4则会引起胚胎干细胞全能性的丧失及分化为滋养外胚层, 过量表达Oct4则会导致胚胎干细胞向原始内胚层样细胞分化[5]。但是, 这两种转录因子不足以维持胚胎干细胞的全能性, 因为在无白血病抑制因子的情况下它们并不起作用。这提示胚胎干细胞体内仍有未被发现的调控基因。 Chambers I 等[6]在胚胎干细胞内发现一种重要基因可促使干细胞不断再生并分化为不同的组织细胞, 它可能是一个主导性的基因, 让胚胎干细胞得以发育并使得干细胞长生不衰。有学者用Nanog这个词代表干细胞的青春能力, 并将此基因命名为Nanog, 象征生命绿洲永不枯竭的意思。Nanog转录因子的过量表达在没有白血病抑制因子的情况下足以维持胚胎干细胞的全能性, 同时其水平与胚胎干细胞全能程度相关[7], 下调Nanog表达水平时会导致小鼠与人的胚胎干细胞分化, Nanog在维持胚胎干细胞全能性上起关键作用。

小鼠Nanog 基因序列全长7.1 kb, 包含4个外显子, 外显子和内含子间的剪接位点符合GT-AG 规则, 同源框序列位于第2和第3外显子。其cDNA 序列由2 184个碱基组成, 含有1个开放阅读框, 编码由305个氨基酸组成的多肽[8]。小鼠Nanog蛋白由280个氨基酸和1个同源盒结构域组成, 在结构上Nanog可以简单地分为3个区域, 即N-端结构域、同源盒结构域和C-端结构域。同源盒结构域由60个氨基酸组成, 执行蛋白-蛋白相互作用功能。N-端结构域包含95个氨基酸, 富含丝氨酸。C-端结构域包含150个氨基酸, 大部分为色氨酸重复序列。通过对这两个DNA结构域进行转录活性检测的结果表明, N-端和C-端结构域均表现出转录激活功能[9], 但C-端结构域的活性要明显高于N-端结构域。对于人Nanog基因的研究表明, 只有C-端结构域才具有转录活性, 提示该结构域是功能结构域。C-端结构域的显著特征是有10个五肽的重复序列, 并均起始于色氨酸, 这个重复现象在人和小鼠中高度保守, 只是在人Nanog中, 1个色氨酸被谷氨酸代替。研究表明, 重复序列是一个强的启动激活子, 并且色氨酸的一致性对于其功能极为重要, 用丙氨酸代替色氨酸其活性完全丧失。C-末端结构域除了含有色氨酸重复序列也包含另一个转录激活模块, 在C-端与重复序列相邻的是由58 个氨基酸组成的区域, 此结构域利用芳香族氨基酸残基独特的转录激活子进行胚胎干细胞的自我更新, 这对于Nanog是必需的。Jianlong W等[10]研究表明, Nanog是通过它的C-末端结构域而不是同源结构域进行二聚化的, 且其二聚化作用必需依赖于与其他全能性转录因子的相互作用, Nanog-Nanog之间的同二聚作用是促进胚胎干细胞维持全能性的重要方面。

2 Nanog与外源信号

在体外培养条件下, 白血病抑制因子和激活的信号转导及转录激活因子3 (STAT-3) 能维持小鼠胚胎干细胞的未分化状态。例如, 通过三苯氧胺诱导STAT3激活时, 小鼠胚胎干细胞的亚全能性在白血病抑制因子缺乏的条件下仍能维持。研究还表明, Nanog过量表达, 小鼠胚胎干细胞在无白血病抑制因子的条件下也可维持其亚全能性。如果Nanog在小鼠胚胎干细胞中过量表达, STAT3的磷酸化水平与野生型相比不会明显改变, 并且激活的STAT3信号通路似乎不影响Nanog的表达。Nanog既不是STAT3途径的一个直接靶基因, 也不能调控STAT3途径。然而对小鼠Nanog启动子的研究表明, 在翻译起始位点上游的5 kb位点处有1个STAT3的结合位点。染色质免疫沉淀分析结果表明, STAT3和Brachyury (中胚层标志基因) 确实在此区域有结合位点, 而且白血病抑制因子可以明显上调与该位点结合的荧光素酶报告基因的表达[11]。这一发现表明, Nanog可能是位于维持胚胎干细胞亚全能性的LIF-STAT3 途径下游的一个直接效应元件, 这也与高水平表达的Nanog能绕过LIF-STAT3信号途径而独立维持小鼠胚胎干细胞未分化状态的事实是一致的。

血清或骨形态发生蛋白信号在胚胎发育过程中的中胚层诱导中发挥作用, 但对于胚胎干细胞的亚全能性似乎有不同的影响效果。在白血病抑制因子缺乏的条件下, 低浓度的血清或骨形态发生蛋白能促进小鼠胚胎干细胞向中胚层分化。而当白血病抑制因子存在时, 相同浓度的血清或骨形态发生蛋白却能维持胚胎干细胞的亚全能性[11]。血清或骨形态发生蛋白属于转化生长因子-β (TGF-β) 超家族成员, 通过与下游效应器SMAD1或与之邻近的SMAD5、SMAD8相互作用来调节信号。有趣的是Nanog能与SMAD1相互作用, 并阻止它们激活蛋白与SMAD1复合体的进一步结合, 由此来抑制血清或骨形态发生蛋白信号途径的活性。鉴于血清或骨形态发生蛋白在胚胎干细胞亚全能性和分化方面的作用, 有研究者提出在Nanog与血清或骨形态发生蛋白之间可能存在一个负反馈调节机制。在这个模型中, 血清或骨形态发生蛋白首先促进中胚层分化, 从而使中胚层分化表达上调, 并阻止神经外胚层的分化。在白血病抑制因子存在的条件下, 激活的STAT3 与Brachyury相互作用从而结合Nanog在启动子上, 结果是Nanog的表达上调。相反, 通过干扰它们的效应器SMAD1可阻断血清或骨形态发生蛋白的活性, 由此来限制中胚层继续发育并最终维持小鼠胚胎干细胞的未分化状态。

3 Nanog的表达与调控

通过对Nanog在小鼠胚胎中表达时相的研究发现, 其mRNA 在胚胎发育到致密桑葚胚期时首次被检测到, 然后被限定在囊胚的内细胞团中, 滋养层中则不表达。在囊胚的末期, Nanog表达进一步被限定在外胚层, 而原始内胚层中不表达。在囊胚植入后, Nanog表达下调, 但可以在小鼠第11.5天的胚胎生殖嵴生殖细胞中检测到。有研究表明, Nanog在人类胎儿卵巢和睾丸中的原始干细胞中有表达[12]。

Nanog基因不仅在早期胚胎发育中表达, 而且它也在胚胎干细胞、胚胎瘤细胞、 胚胎生殖细胞和睾丸原位癌 (CIS) 中表达。目前, 还没有在分化细胞中检测到 Nanog基因表达的报道。关于Nanog表达的调控机制研究甚少。通过对其5′端启动子区的研究表明, Oct4/Sox2于上游转录起始部位-180 bp的复合基序被认为对Nanog的调控有重要影响。研究表明, Oct4与Sox2在体内及体外确实与Nanog启动子结合。进一步的研究表明, Oct4/Sox2基序是Nanog启动子维持胚胎干细胞全能性所必需的。高水平的Nanog对胚胎干细胞自我更新是有效的, 但过量表达Oct4却诱导胚胎干细胞分化, 而且在Oct4缺失的胚胎中, Nanog的表达能通过mRNA原位杂交检测到。研究表明, Nanog在没有Oct4的情况下得以维持, 可能是有其他全能性因子促成Nanog表达的调控。FoxD3是叉头框家族中的一个转录调控因子, 在小鼠胚胎干细胞与早期胚胎中大量表达[13]。FoxD3失效的小鼠胚胎在移植后不久便因为外胚层的丢失而死亡, 同时FoxD3是Nanog的激活蛋白, FoxD3能通过位于转录起始点上游-270 bp的胚胎干细胞专一性增强子激活Nanog的启动子。研究还表明, FoxD3在体内确实与Nanog启动子区域相结合, 相反肿瘤抑制因子p53能与Nanog启动子结合, 抑制Nanog的表达, 使Nanog在胚胎干细胞分化过程中失去抑制作用, 这说明p53在胚胎干细胞分化过程中对Nanog有负调控作用。然而, 当p53-/-胚胎干细胞用全反式维甲酸 (RA) 处理时, Nanog的表达仍然下调。因此, 在胚胎干细胞分化过程中肯定还有其他的负调控因子来调控抑制Nanog的表达。转录因子3 (TCF3) 结合于Nanog启动子的调控区域, 并抑制启动子的激活, 下调Nanog的表达。当转录因子3缺失时能延迟小鼠胚胎干细胞的分化, 并且能提高Nanog的表达水平以利于胚胎干细胞保持自我更新的能力。

4 Nanog与重编程

最近有研究表明, 在细胞融合中, 提高胚胎干细胞的Nanog水平会刺激体细胞基因组全能基因的活化。胚胎干细胞与神经干细胞 (NS细胞) 混合, 胚胎干细胞Nanog的过量表达会将胚胎干-样细胞的数量提高到200倍以上, 同时当胚胎干细胞与分化程度更高的细胞如胸腺细胞或纤维细胞混合时, Nanog亦会提高胚胎干-样细胞的数量。Takahashi K等的研究表明, 小鼠成纤维细胞转导4种因子 (Oct4, Sox2, C-myc, Klf4) 能诱导其成为多能状态。但遗憾的是并没发现Nanog是诱导过程必需的。Jose S等研究表明, 同源蛋白Nanog在细胞获得全能性的一系列复杂过程中发挥着非常关键的组织协调作用, 如果没有Nanog胚胎干细胞将不会发育, 而诱导产生多功能干细胞的过程也会失败。

5 结语

结构基因 篇5

一、选择题(每小题5分,共60分)1.下图表示生物体内核酸的基本单位——核苷酸的模式图,下列说法正确的是()

A.DNA与RNA在核苷酸上的不同点在③方面

B.如果要构成三磷酸腺苷,必须在②位置上加上两个磷酸基团 C.人体内的③有5种,②有2种 D.③在细胞核内共有4种

解析:选C DNA与RNA在核苷酸上的不同点有两处,②五碳糖不同和③含氮碱基不同;要构成三磷酸腺苷必须在①位置上加上两个磷酸基团;③在细胞核中共有5种。

2.(2013·洛阳统考)下列生理过程或生物技术中发生碱基互补配对的有()①受精作用 ②病毒的增殖过程 ③细菌的二分裂过程 ④目的基因与运载体的结合 ⑤细胞的融合 ⑥翻译 ⑦逆转录

A.②③④⑥⑦

C.①②④⑤⑥

B.①③④⑤⑥ D.②③⑥⑦

解析:选A 碱基互补配对发生在DNA的复制、转录、翻译及逆转录过程中。病毒的增殖过程和细菌的二分裂过程都进行遗传物质的复制;目的基因与运载体结合时黏性末端的碱基也要进行互补配对。受精作用与细胞融合是细胞膜相互识别与融合的过程,不涉及碱基互补配对。

3.下图为细胞内某基因(15N标记)结构示意图,A占全部碱基的20%。下列说法错误的是()

A.该基因中不可能含有S元素 B.该基因的碱基(C+G)/(A+T)为3∶2 C.限制性核酸内切酶作用于①部位,DNA解旋酶作用于②部位 D.将该基因置于14N培养液中复制3次后,含15N的脱氧核苷酸链占1/4 解析:选D 基因是有遗传效应的DNA片段,其组成元素有C、H、O、N、P;在双链DNA分子中,A=T,T也占全部碱基的20%,由于A+T+G+C=100%、C=G,得出C和G各占全部碱基的30%,所以该基因的碱基(C+G)/(A+T)为3∶2;限制性核酸内切酶作用于①部位的磷酸二酯键,DNA解旋酶作用于②部位的氢键;在14N培养液中复制3次共产生8个DNA分子,16条脱氧核苷酸链,其中有两条母链含15N,所以含15N的脱氧核苷酸链占子代总脱氧核苷酸链的1/8。

4.(2013·临沂一模)某双链DNA分子中含有200个碱基,一条链上A∶T∶G∶C=1∶2∶3∶4,则该DNA分子()A.四种含氮碱基A∶T∶G∶C=3∶3∶7∶7 B.连续复制两次,需要游离的腺嘌呤脱氧核苷酸120个 C.碱基排列方式共有4100种 D.含有4个游离的磷酸基

解析:选A 该DNA分子的一条链上A∶T∶G∶C=1∶2∶3∶4,另一条链A∶T∶G∶C=2∶1∶4∶3,整个DNA分子中A∶T∶G∶C=3∶3∶7∶7。该DNA分子中A=T=30,G=C=70,连续复制两次,需要腺嘌呤脱氧核苷酸为30×(22-1)=90个;该DNA分子含有100个碱基对,30个A-T碱基对,70个G-C碱基对,碱基排列方式小于4100种;一个DNA分子由两条DNA链组成,含2个游离的磷酸基。

5.下图为真核细胞内某基因(被15N标记)的结构示意图,该基因全部碱基中C占30%,下列说法正确的是()

A.解旋酶作用于①②两处

B.该基因的一条核苷酸链中(C+G)/(A+T)为3∶2 C.若①处后T变为A,则该基因控制的性状一定发生改变

D.该基因在含14N的培养液中复制3次后,含14N的DNA分子占3/4 解析:选B ①处为磷酸二酯键,②处为氢键,解旋酶作用的部位为氢键;由于C占该基因全部碱基的30%,所以A与T均占该基因全部碱基的20%,该基因的一条核苷酸链中(C+G)/(A+T)等于该基因全部碱基中(C+G)/(A+T)=3∶2;若①处后T变为A,突变后的密码子对应的氨基酸不一定改变,则该基因控制的性状不一定发生改变;该基因在含14N的培养液中复制3次后,含14N的DNA分子占100%。

6.(2013·衡阳六校联考)某DNA分子有500个碱基对,其中含有鸟嘌呤300个,该DNA进行连续复制,经测定最后一次复制消耗了周围环境中3 200个腺嘌呤脱氧核苷酸,则该DNA分子共复制了多少次()A.3次

C.5次

B.4次 D.6次

解析:选C 已知该DNA分子有500个碱基对,其中含有300个鸟嘌呤,则A与T均为200个;最后一次复制消耗了3 200个A,因此,最后一次复制净产生的DNA分子数为3 200/200=16(个),则经过复制后,形成的DNA分子总数为32个,因此,这个DNA分子共进行了5(25=32)次复制。

7.右图表示发生在细胞核内的某生理过程,其中a、b、c、d表示脱氧核苷酸链。以下说法正确的是()A.此过程需要ATP和尿嘧啶脱氧核苷酸 B.真核细胞中此过程发生的唯一场所是细胞核 C.b中(A+G)/(T+C)的比值一定与c中的相同 D.正常情况下a、d链都应该到不同的细胞中去

解析:选D 据图可知,此生理过程是DNA的复制。该过程不需要尿嘧啶脱氧核苷酸;真核生物发生此过程的场所有细胞核、线粒体和叶绿体;b中(A+G)/(T+C)的比值与c中的此比值呈倒数关系。

8.用15N同位素标记细菌的DNA分子,再将其放入含14N的培养基上连续繁殖4代,a、b、c为三种DNA分子:a只含15N,b同时含14N和15N,c只含14N。图中表示这三种DNA分子的比例正确的是()

解析:选D 分析题干,DNA分子在含

4N的培养基上连续繁殖4代,可形成16个DNA分子,由于DNA分子的复制是半保留复制,因此16个DNA分子中有2个DNA分子同时含15N和14N,14个DNA分子只含14N,不存在只含有15N的DNA分子。

9.用32P标记玉米体细胞(含20条染色体)的DNA分子双链,再将这些细胞转入不含32P的培养基中培养,让其分裂n次,若一个细胞中的染色体总条数和被32P标记的染色体条数分别是40条和2条,是该细胞至少是处于第几次分裂的分裂期()A.第一次

C.第三次

B.第二次 D.第四次

解析:选C 由染色体总条数为40条可知是分裂后期,若是第一次有丝分裂后期,被32P标记的染色体条数应为40条;若是第二次有丝分裂后期,被32P标记的染色体条数应为20条;若是第三次有丝分裂后期,被32P标记的染色体条数应为0条到20条之间。

10.下列有关基因的叙述,正确的有()①基因是具有遗传效应的DNA片段,全部位于染色体上 ②自然选择使基因发生定向变异 ③某基因的频率即该基因在种群个体总数中所占的比例 ④每一个基因都包含特定的碱基序列,具有特异性 ⑤人体内的肝脏细胞和成熟红细胞所含的基因相同

A.①②④

B.②③⑤ C.只有③

D.只有④

解析:选D 真核细胞的基因位于细胞核中的染色体上及线粒体和叶绿体的DNA上;变异是不定向的自然选择只能使基因频率发生定向改变;在一个种群基因库中,某个基因占全部等位基因数的比率,叫做基因频率;人体内的成熟红细胞没有细胞核和各种细胞器,不含遗传物质。

11.科学研究发现,小鼠体内HMIGIC基因与肥胖直接相关。具有HMIGIC基因缺陷的实验小鼠与作为对照的正常小鼠,吃同样多的高脂肪食物,一段时间后,对照组小鼠变得十分肥胖,而具有HMIGIC基因缺陷的实验小鼠体重仍然保持正常,这说明()A.基因在DNA上

C.基因具有遗传效应

B.基因在染色体上 D.DNA具有遗传效应

解析:选C 正常小鼠吃高脂肪食物会变得肥胖,而具有HMIGIC基因缺陷的小鼠吃同样多的高脂肪食物体重仍保持正常,这说明肥胖由基因控制,从而得出基因能够控制性状,具有遗传效应。

12.下列有关染色体、DNA、基因、脱氧核苷酸的说法,不正确的是().A.基因一定位于染色体上 B.基因在染色体上呈线性排列

C.四种脱氧核苷酸的数目和排列顺序决定了基因的多样性和特异性 D.一条染色体上含有1个或2个DNA分子

解析:选A 基因是具有遗传效应的DNA片段,DNA不一定位于染色体上,因此基因不一定位于染色体上;多个基因位于同一条染色体上,基因在染色体上呈线性排列;不同基因中脱氧核苷酸的数目和排列顺序不同,基因具有多样性,而每一个基因中脱氧核苷酸的数目和排列顺序是特定的,因此基因又具有特异性;没有复制的每条染色体含有1个DNA分子,复制后的每条染色体含有2条染色单体,每条染色单体含有1个DNA分子。

二、非选择题(共40分)13.(20分)(2013·湖北八校联考)下图是某DNA分子的局部结构示意图,请据图回答:

(1)写出下列图中序号代表的结构的中文名称:①__________,⑦________,⑧__________,⑨________。

(2)图中DNA片段中碱基对有________对,该DNA分子应有________个游离的磷酸基。(3)从主链上看,两条单链方向________,从碱基关系看,两条单链________。(4)如果将14N标记的细胞培养在含

5N标记的脱氧核苷酸的培养液中,此图所示的________(填图中序号)中可测到15N。若细胞在该培养液中分裂四次,该DNA分子也复制四次,则得到的子代DNA分子中含14N的DNA分子和含15N的DNA分子的比例为________。

(5)若该DNA分子共有a个碱基,其中腺嘌呤有m个,则该DNA分子复制4次,需要游离的胞嘧啶脱氧核苷酸为________个。

解析:根据碱基互补配对原则可知,①是胞嘧啶,②是腺嘌呤,③是鸟嘌呤,④是胸腺嘧啶,⑤是磷酸基团,⑥是胸腺嘧啶,⑦是脱氧核糖,⑧是胸腺嘧啶脱氧核苷酸,⑨是一条脱氧核苷酸链的片段。复制4次,产生16个DNA分子,由于DNA复制为半保留复制,含14N的DNA分子共2个,所有的DNA都含有15N,所以子代DNA分子中含14N和15N的比例为1∶8。A=T=m,则G=C=a/2-m,复制4次,需要游离的胞嘧啶脱氧核苷酸为(24-1)×(a/2-m)=15·(a/2-m)。

答案:(1)胞嘧啶 脱氧核糖 胸腺嘧啶脱氧核苷酸 一条脱氧核苷酸链的片段(2)4 2(3)反向平行 互补(4)①②③④⑥⑧⑨ 1∶8(5)[15·(a/2-m)] 14.(20分)科学家在研究DNA分子复制方式时进行了如下的实验研究(已知培养用的细菌大约每20 min分裂一次,产生子代,实验结果见相关图示):

实验一:

14细菌――→培养实验二:

15N培养基破碎细菌细离心

――→结果A 胞提取DNA细菌――→培养实验三: N培养基破碎细菌细离心

――→结果B 胞提取DNA

(1)实验

一、实验二的作用是_____________________________________________。(2)从实验二结果C、D看DNA复制__________(是,不是)半保留复制。

(3)如果实验三的结果都为F,据此可判断DNA分子的复制方式________(是,不是)半保留复制。

(4)如果DNA的复制方式是半保留复制,若某次实验的结果中,结果C比以往实验结果所呈现的带略宽,可能的原因是新合成DNA单链中的N尚有少部分为__________。

(5)如果DNA的复制方式是半保留复制,与结果D相比,结果E密度带的数量和位置________,宽度不同的是________带。

解析:(1)实验一和实验二分别表示14N和15N标记的DNA的离心结果,其作用是与后面的实验结果形成对照。

(2)从结果C、D看新形成的DNA分子保留了原来DNA的一条链,DNA复制具有半保留复制的特点。

(3)结果F表明原来被15N标记的DNA的两条链没有分开。(4)“中带”为15N/14N,“中带”略宽,说明新合成的DNA分子之间的相对分子质量有差别,原因可能是新合成的DNA单链中的N尚有少部分为15N。

(5)结果D和结果E都有2个15N/14N,结果D有2个14N/14N,而结果E有6个14N/14N,所以结果E密度带的数量和位置没有变化,宽度发生变化是轻带。

基因组先驱畅谈基因测序 篇6

十四位“基因组先驱”聚集在麻省剑桥的微软会议中心,分享各自的早期基因组实践经验,他们每个人都做了自己的整个基因组测序。这次会议被称作“所有已经做过自己基因组测序的人聚在同一个屋檐下的最后机会”,专家预测,到2010年底,将有1000人的基因组被完全测序。虽然德斯蒙德·图图(Desmond Tutu,南非大主教)和格伦·克洛斯(Glenn Close,好莱坞女星)没有出席(他俩都做了自己的基因组测序),其他人都勇敢地被国家公共电台(NPR)的科学节目《收音机实验室》(Radiolabs)的主持人罗伯特·克鲁维奇(Robert Krulwich)请上舞台,分享了他们为什么要做自己基因组测序的想法,以及他们会如何使用这些信息。

下面是一些会议的有趣花絮。

测序公司的高管很喜欢将他们自己的基因组测序。十四位先驱中有4个是高管:杰伊·福雷特雷(Jay Flately),Illumina公司首席执行官;格雷格·卢西尔(GregLucier),生命科技(LifeTechnologies)的首席执行官;斯蒂芬·奎克(Stephen Quake),Helicosg公司的创始人(准确的说不算高管);约翰·韦斯特(John West),Solexa被Illumina公司收购前的首席执行官。

基因测序正成为一件家庭大事。韦斯特已经为他的妻子和两个孩子做了测序,卢西尔也计划这样做。哈佛大学教授亨利·路易斯·盖茨(HenryLouisGas)和他的父亲成为第一个非裔美国人和第一对父子共同做了基因组测序,他们在盖茨的公众电视台(PBS)的纪录片《美国面孔》中分享了这一成果。测序家庭确实有一些优势,比如,让科学家们从测序错误中更容易分辨出真正的遗传变异。

保险公司不希望看到你的基因组。企业家伊斯特·戴森(Ester Dyson)正在与俄罗斯宇航员一起进行太空飞行训练,她将自己的基因组序列提供给健康保险公司,申请生命保险。他们拒绝了她。保险公司是不允许根据受保者的遗传信息进行不同对待的,戴森说,保险责任可能是一个考虑因素。但戴森指出,从长远来说,健康保险公司促进预防性药物的努力将因为无法获得病人的基因组而受到阻碍。

基因组先驱们已经厌倦了有关隐私的问题。克鲁维奇向几位嘉宾探寻了有关隐私的问题,例如,一家公司是否愿意透露一个高管潜在的健康风险。约翰·韦斯特总结到:“伊斯特想被俄罗斯的火箭扔到太空里去,可你却问她基因组测序的风险?”

妻子们和母亲们似乎对公开发表她们的基因组持更谨慎的态度。17岁的安·韦斯特(Anne West)在会上介绍了她全家的基因组分析。她说,她的母亲朱迪对自己的基因组秘密,以保护孩子们的隐私权。(他们基因组的一半来自母亲,另一半来自父亲,父亲的已经公开了。)弗拉特利和奎克都说,他们的妻子不希望被测序。当提到这是个明显的趋势时,奎克打趣地说,“她们通常更明智。”

个人基因组测序仍主要是自人男性的领域,至少在研究以外的领域。会上的十四名先驱中有3名妇女(包括17岁的安·韦斯特),一位亚裔和一位非裔美国人。已经有一些非裔和亚裔的基因组被测序了,有私自的,有供研究用的,也有很少数的妇女,部分是为了她们的乳腺癌基因组。

分析基因组比测序要困难得多。这是现在基因学圈子里都尽量避免的问题,研究人员们和初创企业几乎都在钻研这个未知的领域。奎克在斯坦福大学招募了一个医生和科学家的团队,分析他自己的基因组。韦斯特说,他的家庭在寻找一个解读他们基因组的公司,因为他们自己花了几个月的时间,只分析出一两个基因。

结构基因 篇7

蓝藻是一类光合自养型原核生物, 目前已有超过1 500具有不同形态特征的蓝藻种类被发现并报道。蓝藻与其他光合细菌最大的区别在于它能够利用水作为电子受体[1]。被普遍接受的观点认为蓝藻祖先在早期进化过程中获得了光合作用的能力, 并通过内共生形式影响植物叶绿体的形成, 同时自身在结构和功能上也获得了许多植物细胞的属性[2]。自从基因工程技术被大量运用到蓝藻菌株, 他们在很长时间内都被作为研究光合作用、信号传导、氮固定等调控过程的模式菌株。如今由于海洋湖泊的富营养化, 全球各地爆发了大量蓝藻引起的水华事件, 危机人们的健康和水生生物的生存, 因此对它的研究始终没有间断[3]。

聚球藻属最早发现于1979年, 它们构成了海洋食物链的基础并参与大约20~40%光合产物的制造和碳固定过程, 是海洋和地球生态环境的重要组成部分。这个种属的菌株完全适应了海洋环境, 相比其他淡水菌株来说, 他们在生长过程中对Na+、Cl-、Mg2+和Ca2+的需求量都大幅提高。聚球藻能够在贫瘠的水域吸收必需的营养物质和微量元素, 他们的光吸收系统也会根据光谱变化而改变以达到光合作用的目的[4]。另外, 聚球藻菌株可以在没有外部细胞器的推动下促使自身向前运动, 这与其他具有类似运动方式的微生物完全不同。已测序的11个聚球藻菌株的基因组都小于3M, 基因总数少于3 000个。但最近新发现的菌株Synechococcus sp.PCC 7336测序结果显示其基因组大于5M, ORF总数大于5 000个, 很有可能具有某些特殊结构和调控方式, 目前还没有任何文献对其进行研究报道, 因此我们构建了两个本地数据库, 并结合多种生物信息学方法, 通过序列特征、基因功能和进化过程三个方面展开研究, 希望能对聚球藻的认识上获得新的突破。

1 材料与方法

1.1 材料

Synechococcus sp.PCC 7336基因组数据来自NCBI, 检索号:NZ_ALWC01000000。其余用于比对的基因组均来自NCBI基因组组装/注释计划 (ftp://ftp.ncbi.nlm.nih.gov/genomes/) 。

2.2 方法

2.2.1 基因组基本信息分析

Gene Mark S+[5]在预测长序列时具有较好的效果, 在本文中被用来预测ORF;Z-curve[6]计算GC含量, Gen Skew[7]分析GC累计偏移率;Trf[8]寻找各种类型的重复序列和回文序列;tRNAscan-SE 1.21[9]预测tRNA编码基因, RNAmmer 1.2[10]预测rRNA编码基因。

2.2.2 本地比对数据库的构建

1) 从NCBI下载Blast-2.2.28程序 (ftp://ftp.ncbi.nlm.nih.gov/blast/) 和非冗余数据库 (ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/) ;

2) 将数据库格式化成蛋白质类型;

makeblastdb.exe-in rat.fasta-parse_seqids-hash_index-dbtype prot

3) 进行本地化比对过程, 阈值P<1e10;

blastp.exe-task blastp-query rat1.fasta-db rat.fastaout text.txt

2.2.3 本地注释数据库的构建

1) 下载并安装mysql服务器 (http://dev.mysql.com/downloads) ;安装JAVA和Microsoft.NET Framework 2.0以上程序;

2) 下载并解压以下数据包:local_b2g_db.zip, go_2013011-assocdb-data.gz, gene_info.gz, gene2accession.gz, b2g4pipe_v2.5.zip, idmapping.tb.gz;

3) 执行命令为本地用户创建新的数据库和表格;

mysql-h localhost-uroot-proot<b2gdb.sql

4) 创建数据库用户;

mysql-h localhost-uroot-proot-e“GRANT ALL ON b2gdb.*TO’blast2go’@’localhost’IDENTIFIED BY’blast4it’;”

mysql-h localhost-uroot-proot-e“FLUSH PRIVI-LEGES;”

5) 将第二步中解压文件导入数据库和表格当中;

mysql-h localhost-uroot-proot b2gdb-e“LOAD DA-TA LOCAL INFILE’dataname’INTO TABLE dataname FIELDS TERMINATED BYt”LINES TERMINATED BYn“;”

6) 进行本地blastx比对, 将比对结果放在b2g Pipe文件夹下并运行以下命令:

java-Xmx1000m-cp*;ext/*;es.blast2go.prog.B2GAnnot Pipe-in result.xml-out mapping-results-prop b2g Pipe.properties-annot-dat-img-ips ipsr-annex-goslim-wiki html_template.html–v;

7) 待程序运行完毕得到结果, 整理分析数据。

2.2.4 次级代谢调控路径分析

利用多序列比对和NRPS-PKS代谢数据库预测分析Synechococcus sp.PCC 7336 NRPS/PKS杂合酶基因簇特征, 然后根据编码蛋白同线性关系和向量机学习方法[11]预测产物立体结构。

2.2.5 进化分析

选取22个代表性蓝藻菌株的16S rRNA, 分别利用基于不同原理的最大似然法、邻接法和最大简约法构建进化树[12], 比较进化树之间的差异, 并对Synechococcus sp.PCC 7336进行分类鉴定。

2结果与分析

2.1 Synechococcus sp.PCC 7336的基因组序列特征

PCC7336基因组全长5 066 637 bp, 核苷酸比率分别为A:23.10%, C:26.73%, G:26.98%, T:23.17%, G+C含量为53.7%, 与聚球藻属其他成员相比处于中等水平。GC偏移分析显示PCC7336的GC碱基分布也呈现不均匀状态 (图1) 。GC含量先下降再上升呈V字形, 前半部分为滞后链, 而后半部分为先导链, 复制起点位于曲线转折点即2 522 860 bp处。

我们通过本地注释数据库分析一共得到5 096个蛋白质编码基因, 编码碱基的总长度为4 251 462 bp, 编码率为82.73%。最短和最长的基因分别为114和29 397 bp, 平均编码长度为834 bp, 但对所有基因的碱基长度统计发现小于700 bp的基因共有3 326个, 占基因总数的六成以上。对每个基因GC含量的统计发现GC值在49~57%之间的基因总共有3 134个, 占基因总数的一半以上, 与整个基因组的GC值保持一致。

整个基因组预测得到47个RNA基因, 其中包含两个rRNA基因簇, 长度均为4 925bp, 相距大约927kb。第一个以16S RNA、Ile-tRNA、Ala-tRNA、23S RNA和5S RNA的顺序排列, 第二个中间两个tRNA的顺序发生了交换, 并不完全是第一个的拷贝, 这与蓝藻其他菌株通常含有两个完全相同的拷贝数相区别。43个tRNA基因包含了40个不同的tRNA种类, 除了Met-tRNA、Ile-tRNA和Ala-tRNA含有两个拷贝外, 其余tRNA都是单拷贝并散列于整个基因组上, 不像rRNA以成簇的形式存在, 极有可能是独立转录的。另外, 我们在23S RNA序列中也发现同样存在于其他蓝藻菌株中可编码内切酶的groupⅠintron。这个内含子与蓝藻的系统进化关系密切, 属于I-Cre I亚家族, 许多tRNALeu和tRNAf Met也含有此内含子。RNA分子在进化过程中表现出比蛋白质更稳定的属性, 可以反映物种本身对环境的适应程度。RNA编码基因在环境胁迫下会发生适应性的进化, GC含量的增加是一个重要的指标。研究表明来自于盐碱湖泊的蓝藻Cyanospira和Anabaenopsis, 以及来自干旱地区的nostoc, RNA分子的GC取代无论在能量还是功能上都具有选择的优势, GC含量的增加反应了GC功能的重要性[13]。而对于来自加利福利亚海边的PCC7336来说, 适宜的生存环境让选择压力对基因成分的影响微乎其微, 统计发现47个RNA基因的GC含量都不高, 与整个基因组的GC含量保持一致。

PCC7336基因组上共发现8个CRISPR基序, 每个基序都具有一个长约36bp的直接重复序列。直接重复序列具有二重对称性, 有可能会形成发夹结构而不是真正的回文序列。在这8个CRISPR周围都发现与之关联的基因, CRISPR通常与核酸酶或解旋酶共同发挥作用, CRISPR/cas是广泛分布于蓝藻中的一种调控体系, 在获得性免疫方面扮演重要角色[14]。在本文8个CRISPR序列周围也都发现了与之关联的基因, 例如Csm5_family和Crm2_family CRISPR-associated RAMP蛋白。这些来自不同家族的蛋白与CRISPR一同构成CRISPR/cas亚型, 在PCC7336中至少存在5种不同的亚型, 反应了菌株在进化过程中基因水平转移的多样性。除CRISPR外, 还发现268个串联重复序列, 拷贝数基本不超过10个, 其中80%的序列长度小于60bp, 被称为小卫星。这些串联重复序列的存在有助于确定基因组的遗传特性。某些蓝藻基因组一个显著的特征是含有高度重复序列HIP1, 研究表明HIP1与Opc A蛋白或DAM甲基化酶的存在有关, 可作为分析不同种属蓝藻同源关系和基因水平转移的参考因素之一[15]。我们在PCC7336中也发现7 371个拷贝的HIP1, 与已经证实的其他菌株相比, HIP1的拷贝数与基因组大小成正相关, HIP1在PCC7336出现的频率 (1 copy per 687 bp) 也大于Synechocystis (1 copy per 1131 bp) 、Anabaena (1 copy per 1219 bp) 和Thermosynechococcus (1 copy per 705 bp) 等多数蓝藻菌株。

2.2与光合作用相关的基因

光合作用是蓝藻赖以生存的重要细胞活动, 在PCC7336中发现共有116个基因与光合作用相关, 主要分为以下几类:光系统Ⅰ、光系统Ⅱ、ATP合成酶、CO2固定、NADH脱氢酶、胆藻体蛋白、细胞色素氧化酶、细胞色素b6lf复合体和电子载体。组成光系统反应复合体的结构蛋白通常含有两个或两个以上的拷贝, 例如psb A、psb B、psb C、psb D、psb V和psb Z等, 而功能蛋白例如锰固定蛋白psb O、磷蛋白psb H、醌结合蛋白Ycf39和组装蛋白Ycf48等只含有一个拷贝。这些蛋白虽然都属于同一家族, 且需要相互作用来参与光合反应, 但他们在基因组上的分布非常分散, 并不像传统的β-半乳糖苷酶操纵子一样连续排列形成基因簇, 我们推测这些基因或许是受全局性的调控因子调控。PCC7336参与光合作用的基因数量与聚球藻其他菌株大致相同, 都含有psa、psb和atp等核心组成蛋白, 仅仅是在某些功能蛋白上有所不同, 这与环境胁迫、基因水平转移和进化速率等因素密切相关。PCC7336还具有一些参与光合作用的稀有蛋白, 例如V型ATP聚合酶亚基ABC-DEIK。序列比对发现他们在蓝藻基因组中并不常见, 除PCC7336外只在Synechococcus sp.WH 5701、Cyanothece sp.PCC8801和Cyanothece sp.PCC 8802中发现其踪迹。这些蛋白位于同一基因簇上, 与常见的atp聚合酶蛋白家族也存在差异。V型ATP聚合酶是一类古老的、高度保守的聚合酶, 广泛存在于真核生物如植物中。他们除了聚合催化作用外, 还能够酸化细胞内一系列细胞器并能将质子泵出细胞膜。另外一些存在于高等植物基因组上参与光合作用的psb蛋白家族小亚基例如psb P、psb Q和psb S等也没有在PCC7336基因组中发现。PCC7336基因组还缺少真核生物和高等植物中普遍含有的聚光蛋白 (LHCI) , 光系统Ⅰ蛋白复合体大多以多聚体形态而不是真核生物的单体状态发挥功能, 虽然他们具有类似的电子传递链。

2.3 与信号传递相关的基因

另一个对蓝藻生存至关重要的调控路径是信号传导, 以“双组分调控系统”为代表, 由一个感应激酶和一个应答调控子构成。这是一个自磷酸化反应, 磷酰基从三磷酸腺苷 (ATP) 转移到特定的组氨酸激酶残基上引发信号传导, 响应调控子的天冬氨酸残基被磷酸化, 其整体构型发生改变而被激活, 与目标基因结构域结合以促进或抑制基因表达。在PCC7336中, 我们共发现107个与信号传导密切相关的基因, 包含16个常规的组氨酸激酶、7个双鸟苷酸环化酶/磷酸二酯酶蛋白、6个环磷酸腺苷激酶、1个生物钟节律激酶Sas A、1个磷酸盐激酶PhoR、1个CO2感应蛋白。在调控子方面, 基因编码39个常规转录调控子、26个双组分调控子、5个激酶/应答调控子杂合体、4个双组分转录调控子、4个DNA绑定调控子及若干特定目标的调控子, 如尿嘧啶、丝氨酸、二磷酸核酮糖羧化酶、核苷酸还原酶、氮、铁、芳香烃调控子。与已研究的其他菌株相比发现, 调控子数量与菌株基因组大小一般呈正比关系, 调控子所属蛋白家族种类与基因组大小却没有明显关联性 (表1) 。其余4个菌株的调控子多集中于OmpR、LuxR和LysR家族, 而PCC7336的调控子数量虽然只有Gloeobacter7421的一半, 但类型最多, 分布均匀, 除了常见类型的调控子外, 还有许多特有的调控子, 例如Abr B、Crp/Fnr、HxlR等独立调控子和Pho B、NrdR这类针对特定蛋白酶的调控子。这些调控子可以对多种信号刺激做出响应, 改变基因表达水平和代谢方式来应对环境胁迫, 由此说明PCC7336具有更加灵活多样的细胞调控方式, 相对Anabaena 29413来说, 这种应答可能更多依赖转录调控子而非sigma因子。

2.4 NRPS/PKS调控路径相关的基因

蓝藻是生物活性物质的重要来源, 这些含氮复合物大分子主要由多模块非核糖体肽合成酶 (NRPS) 或聚酮合酶 (PKS) 系统合成。我们将PCC7336基因组与数据库中含有NRPS/PKS模块的其他基因组进行比对和特征分析共发现了11个次级代谢基因簇, 主要由PKS路径产生, 包括四氢甲基嘧啶羧酸、细菌素、萜烯和丁内酯四类, 一个NRPS路径和一个NRPS/PKS杂合路径, 其中NRPS/PKS杂合基因簇最长为99552 bp, 包含13个合成基因、4个转运基因、2个调控基因和27个其他类型的基因。合成基因是整个合成体系的核心, 他们的编码蛋白种类往往决定了次级代谢产物的结构和功能。以最长的Nrps-t1pks杂合基因簇为例, 第一个与最后一个合成基因位于基因簇首尾两端, 分别编码原卟啉原氧化酶和短杆菌肽脱氢酶, 中间11个基因主要编码特定的氨基酸, 与前后两端编码蛋白酶的基因差异较大。这11个合成基因编码产物相互连接顺序如下: (pro) + (mal) + (asp) + (aspgly) + (gly) + (mal) + (leu-lys) + (mal) + (pkmal) 。然后我们对整个基因簇进行同线性分析并利用支持向量机方法在数据库中已有模型基础上预测得到了次级产物的立体结构 (图2) 。可以看出该产物主要为线性结构, 没有一个完整的苯环和单键氯原子, 取而代之的是大量双键氧原子, 与海洋蓝藻产生的Jamaicamide型脂质更相似[16]。

2.5 进化分析

16S rRNA几乎存在于所有生物体内, 具有恒定的表达量和重要的生理功能。编码16S rRNA的基因既有保守区也有可变区, 保守性能够反映物种的亲缘关系, 而可变性则体现了物种之间的差异, 使得16S rRNA作为一个分子指标广泛地用于各种微生物的遗传特征和分子差异的研究。我们选取了具有代表性的22个蓝藻菌株16S rRNA, 利用三种不同原理的方法构建进化树, 结果显示三种方法构建的进化树惊人的一致 (图3) , 说明可靠性较高。从图3中可以看出, 菌株分为海洋型和淡水型两大类, 海洋型蓝藻中原绿球藻全部聚在一起, 保守程度较高。聚球藻菌株基因组差异较大, 除了4个菌株与原绿球藻同属一个分支外, 另一分支包括了聚球藻、嗜热藻和无类囊体蓝藻三种类型。PCC7336恰好位于这个分支且没有与其他任何菌株聚在一起, 说明不仅16S rRNA序列与众不同, 其整个基因组在进化过程中也发生了较大改变, 从而脱离出来单独成为一支。与PCC7336亲缘关系最近的为聚球藻JA-2-3Ba (2-13) 和无类囊体蓝藻PCC7421。目前对JA-2-3Ba (2-13) 的研究寥寥无几, 而对PCC7421的研究结果来看, 与PCC7336存在许多相似之处。例如两者都属于单细胞革兰氏阴性菌, 基因组大小和GC含量相差无几, 丢失了光系统Ⅰ和光系统Ⅱ的某些调控基因。PCC7421尽管含有4430个基因, 但只有610个能够与其他蓝藻菌株同源匹配, 其中有一半是未知蛋白基因。另外PCC7421缺乏一个内部类囊体膜系统, 但又比其他菌株多一个细菌性4步去饱和酶体系。从这些差异都可以看出PCC7421跟PCC7336一样都有许多独特之处, 或许可以作为今后研究PCC7336的参考依据。

3 讨论

本文通过构建本地比对数据库和注释数据库等方法对PCC7336菌株基因组全序列进行分析, 得到许多有用信息。在碱基构成上, 该菌株与聚球藻其他菌株本无太大差别, 但基因数量多了一倍, 且大多编码长度小于700bp的蛋白。这些蛋白经过蛋白质数据库比对后大多没有发现同源序列, 他们的功能还有待考证。从进化树分析来看, PCC7336与常见的聚球藻菌株之间的亲缘关系没有预想中比紧密, 反而与无类囊体蓝藻在基因组序列和组成上更一致, 而且PCC7336比其他短小紧凑类型的聚球藻菌株出现时间更早。Patrick M.Shih等人在分离该菌株时指出PCC7336为自由生存方式, 暗示没有或很少与环境中其他物种发生遗传物质交换, 调控代谢过程也较独立[17]。而以WH7803为代表的其他聚球藻菌株研究结果来看, 他们的基因组重构和基因水平转移频率更高, 可以推断早期聚球藻基因组结构应该更接近PCC7336, 除了含有生命活动所必需的基因外, 还有一些未知蛋白编码基因和冗余序列。在漫长的进化过程中, 由于环境适应性、宿主影响等因素使得大多数聚球藻基因组只保留了核心序列和功能, 变得更紧凑。PCC7336基因的产物主要定位于胞内和细胞组成成分如细胞膜上, 大多具有绑定和催化的分子功能, 从相关研究可以发现, 这些产物主要参与细胞繁殖、免疫、节律、信号传导和次级代谢等生物过程。PCC7336的次级产物大多有PKS途径合成, 仅有一条NRPSPKS杂合途径, 且次级代谢基因簇中结构基因数量总体偏少, 不含有典型的nda、mcy基因, 长度较这两种类型短了很多, 与整个基因组长度成反比关系。单一的线性构型和基团类型也会限制其功能的多样性。蛋白质序列比对和基因组全序列比对两种方式得到的结果都表明PCC7336含有的必需调控基因不仅与其他蓝藻菌株相同, 与其他物种也有很多相似之处。差异的形成除了亲缘关系远近的因素外, 更多的与菌株生活环境有很大关系。

目前蓝藻新菌株的测序工作一直在进行当中, Huansheng Cao利用454型测序仪获得了Aphanizomenon flos-aquae NIES-81的基因组草图, 但缺口多达110个, 没有做深入分析[18]。Sergey Stolyar获得了Thermosynechococcus sp.Strain NK55a的全基因组序列, 只概括描述了基本结构信息[19]。JN Morris在实验室培养并测序了Synechocystis sp.PCC 6803的两个变异菌株, 比较了突变位点之间的差异[20]。Takatomo Fujisawa将许多新测序的蓝藻基因组收集并录入专门的数据库供全世界科研工作者使用[21], 但大多数科学家更愿意研究熟悉的模式菌株, 而新测序的非模式菌株还有很大的研究空间和潜力。本文选取的PCC7336作为聚球藻中一个独特的类型具有很高的研究意义, 它虽然发现较晚, 但存在于地球的时间更长, 结构更为古老, 对它的研究可以让我们更清楚聚球藻这个种属的发展进化历程、形态变化过程及生活方式的转变过程。而且我们建立了一套快速、有效、全面的研究基因组的方法, 适用于任何新测序的基因组研究, 通过综合分析获得各方面、多层次的有用信息, 为今后的实验研究奠定基础。下一步我们将深入分析PCC7336特异性序列和基因在生命活动中扮演的角色, 并根据已有研究结果将分子调控和表型特征结合, 从微观到宏观全面了解PCC7336。

摘要:目的:对新测序菌株Synechococcus sp.PCC 7336的基因组结构分析。方法:利用多种生物信息学工具进行基本信息分析。构建本地比对数据库进行多序列比对分析。构建本地注释数据库进行基因、蛋白质功能分析。基于16S rRNA构建进化树对不同菌株进行聚类并分析进化差异。结果:GC含量为53.7%, 共有5 096个蛋白质编码基因, 47个RNA基因和不同类型的重复回文序列。与光合作用相关的基因分为9大类, 信号传导以“双组分调控系统”为代表, 11个次级代谢基因簇合成生物活性物质。进化分析显示其与传统聚球藻菌株差异较大, 而与无类囊体蓝藻亲缘关系更密切。结论:Synechococcus sp.PCC 7336是聚球藻属中一个特殊的菌株, 在基因组结构、基因数量、进化历程等方面都与其他菌株存在较大差异。

结构基因 篇8

TERE1/UBIAD1/Heix与人类癌症、脂代谢紊乱及神经退行性疾病等许多重大疾病密切相关。家系研究发现TERE1/UBIAD1基因突变能导致一种很罕见的显性遗传病-施奈德结晶状角膜营养不良(schnyder crystalline corneal dystrophy,SCCD),该疾病主要的特征为系统脂代谢紊乱,脂质局部堆积而引起角膜进行性乳浊化[4,5]。本研究实验报道TERE1/UBIAD1与膀胱癌、脂代谢紊乱等密切相关[6]。TERE1/UBIAD1/Heix基因可能是一类新的抑癌基因。但TERE1/UBIAD1如何连接脂质代谢与肿瘤,其分子机制并不清楚。异戊烯化转移酶功能域(prenyltransferase activity)(Accession:GO:0004659),即能催化异戊烯基团从一种化合物转移到另一种化合物反应,但其酶学反应机制有待阐明。

目前只有ORR等采用ConSurf生物信息学软件计算了TERE1部分保守区的氨基酸位置并预测了其三维空间结构,但TERE1的空间结构及功能并不清楚[5]。本研究主要采用生物信息软件分析TERE1蛋白的跨膜结构,并预测分析其重要蛋白结构域功能。构建pEGFP-TERE1真核表达质粒,转染膀胱癌细胞系T24并检测其在细胞中表达定位。此研究将为阐明TERE1的结构、特别是其异戊烯转移酶的功能活性作铺垫,从而为临床抗肿瘤药物筛选及肿瘤靶向性治疗奠定坚实的基础。

1 材料与方法

1.1 材料与试剂

pOTB7-TERE1质粒(Hs7L,购自open biosystems公司),pEGFP-N1质粒(Invitrogen公司)。大肠杆菌DH5α由本实验室保存。膀胱癌细胞株T24细胞(购自ATCC公司),DMEM培养基(Invitrogen公司),胎牛血清(杭州四季青公司)。Taq DNA聚合酶、EcoRⅠ酶、XhoⅠ酶、T4 DNA ligase(Promega),1kb DNA Marker、200 bp DNA Marker(Fermentas),Universal DNA Purification Kit(DNA纯化回收试剂盒(北京天根生化有限公司),胰蛋白胨(英国Oxiod),琼脂糖(Promega),高纯度质粒小提中量试剂盒(北京天根生化有限公司DP107-02)。LipofectamineTM2000转染试剂(Invitrogen),Opti-MEMI Reduced Serum Medium 500 m L(Invitrogen)。

1.2 仪器与设备

低温高速冷冻离心机(Thermo,USA),SZ-93自动双重纯水蒸馏器(上海亚荣生化仪器厂),二氧化碳培养箱(SANYO,Japan),PCR仪(AB Applied Biosystems,USA),UV透视仪及摄影装置(德国Eppendorf),倒置显微镜(COIC重庆光学仪器厂),IX71-141倒置荧光显微镜(Olympus公司),激光共聚焦显微镜(德国Leica公司),荧光分光光度计RF-5000(日本岛津公司),图像分析系统(Image-pro-plus,USA)ECM399电转仪(BTX)等。

1.3 实验方法

1.3.1 实验过程1

TERE1/UBIAD1生物信息学分析:人类UBIAD1基因序列(GeneID:29914)来自[http://www.ncbi.nlm.nih.gov],(AAD27581.1|AF117064_1),Heix(GenBank:AAF53515.1)来自[http://www.ncbi.nlm.nih.gov],序列比对软件ClustalX用于分析UbiA类异戊烯转移酶家族部分成员的氨基酸序列。TERE1/UBIAD1(GenBank:AAD27581.1)蛋白2级结构跨膜区预测软件:SOSUI、TMpred、SPLIT4.0和TMHMM 2.0;蛋白质功能预测软件PROSITE;蛋白质3级结构分析软件:SWISS-MODEL,TOPITS,fisvr。

1.3.2 实验过程2

TERE1-GFP表达载体的构建及鉴定:TERE1片段准备:(1)设计TERE1基因PCR引物。TERE1引物(Invitrogen公司):Sense primer:5'-CTTCCATGGCGGCCTCTC-3',Antisenseprimer:5'-GGCAGGAGTTCCCACCCA-3'。加酶切位点和保护碱基的TERE1引物:Sense primer(划线部分为EcoR 1酶切位点,ATAT为保护碱基):5'-ATAT,GAATTCCTTCCATGGCGGCCTCTC-3';Antisenseprimer(划线部分为Xho1酶切位点,ATAT为保护碱基):5'-ATAT,CTCGAGGGCAGGAGTTCCCACCCA-3'。(2)PCR扩增TERE1基因全长序列:以pOTB7-TERE1质粒为模板,用TERE1引物进行PCR扩增反应。(3)TERE1基因PCR产物的纯化:依照Universal DNA Purification Kit(DNA纯化回收试剂盒)操作。(4)TERE1基因的双酶切:将浓缩后的PCR产物,在37℃采用EcoR1和Xho1进行双酶切反应过夜。(5)双酶切产物琼脂糖凝胶电泳及酶切产物凝胶回收。

载体pEGFP-N1的准备:将pEGFP-N1质粒双酶切(酶切位点:EcoRⅠ与XhoⅠ),载体pEGFP-N1在37℃双酶切反应过夜。pEGFP-N1胶回收纯化。

TERE1基因片段与pEGFP-N1片段的连接:依次将所获得的经双酶切后的TERE1基因片段和pEGFP-N1片段及其他反应成分加入到EP管中,混合,置于16℃水浴过夜。

pEGFP-TERE1重组质粒电击化DH5α感受态细胞。

含pEGFP-TERE1重组质粒的细菌菌落的筛选鉴定:将克隆的pEGFP-TERE1重组质粒采用菌液PCR验证、双酶切验证、测序验证。

1.3.3 实验过程3

pEGFP-TERE1重组质粒的真核细胞转染:将构建成功的pEGFP-TERE1重组质粒采用脂质体方法转染人膀胱癌细胞系T24,实验分组(阴性对照组1:只加pEGFP-TERE1重组质粒;阴性对照组2:只加脂质体Lipofectamine 2000;实验组:加pEGFP-TERE1重组质粒和Lipofectamine 2000),孵育24 h后即可在激光共聚焦显微镜下观察。

1.3统计学分析

采用统计学软件SPSS 11.0进行统计分析,实验数据用均数±标准差(x±s)表示,用t检验分析各组数据,P<0.05表示差异具有显著性,P<0.01表示差异具有极显著性。

2 结果

2.1 人类TERE1生物信息学分析

2.1.1 TERE1膜蛋白2级结构预测分析

采用SOSUI软件分析TERE1为8次跨膜的膜蛋白,跨膜区特点如下(见图1)。

采用TMpred软件分析TERE1蛋白含8次跨膜结构(见图2)。

SPLIT 4.0软件预测UBIAD1蛋白含9次跨膜结构(见图3)。

采用TMHMM软件分析TERE1蛋白跨膜位置及结构模式(见图4)。

4种软件综合分析结果:将选择的4种生物信息学软件对TERE1蛋白2级结构跨膜结构预测分析总结见附表,结果显示在第80~105位氨基酸、第131~153位氨基酸、第156~180、第242~267位氨基酸、第313~334位氨基区域,4种软件均一致预测其为按顺序排列的跨膜部分,结构保守。这些跨膜的部分在空间上形成3个环(Loop1、Loop2、Loop3)(见图1),这些环所在的氨基酸残基有相互作用。

2.1.2 蛋白空间与结构功能分析

目前已发现的SCCD疾病UBIAD1基因突变位点总结见图5-1。其中N10S、D112G、D118G、R119G位于UBIAD1蛋白跨膜结构的Loop1中,L121F、S171P、T175I、G177R、G186R位于UBIAD1蛋白跨膜结构的Loop2中,N232S、D236E位于UBIAD1蛋白跨膜结构的Loop3中。

根据蛋白跨膜结构预测分析结果,异戊烯化转移酶家族成员TERE1蛋白为多次跨膜的蛋白,保守的区域loop2和loop3含有多个SCCD疾病UBIAD1基因突变位点,进一步以此区域采用PROSITE软件进行蛋白一致性结构预测(PDOC00727)。根据PROSITE软件分析结果显示UbiA类异戊烯转移酶家族(PS00943)具有一致性序列(consensus sequence),其序列模式为:N-x(3)-[DEH]-x(2)-[LIMFYT]-D-x(2)-[VM]-x-R-[ST]-x(2)-R-x(4)-[GYNKR],其中X表示任意氨基酸(如图5-2,图6)。图示:N、D、D、R、T、R、G为UbiA类异戊烯转移酶家族一致性序列中保守的氨基酸。

2.1.3 UbiA类异戊烯转移酶家族部分成员进化树分析

采用ClustalX软件比对UbiA类异戊烯转移酶家族部分成员氨基酸序列,得出进化关系(如图6)。

2.2 p EGFP-TERE1重组质粒的构建实验结果

2.2.1 TERE1基因PCR扩增结果(片段大小约1 143 bp)

以pOTB7-TERE1质粒为模板,用合成的TERE1引物进行PCR反应,扩增出大小为1 143bp的片段(见图7)。

2.2.2 pEGFP-TERE1重组质粒PCR结果

将连接的pEGFP-TERE1重组质粒电击转化大肠杆菌,涂平板,挑单克隆进行菌液PCR电泳结果见图8,出现5.8 kb的条带。

2.2.3 pEGFP-TERE1重组质粒双酶切验证结果

将连接的pEGFP-TERE1重组质粒再进行EcoRⅠ与XhoⅠ双酶切,用1%琼脂糖凝胶电泳结果见图9。

2.2.4 pEGFP-TERE1重组质粒测序结果

将电泳鉴定为阳性的pEGFP-TERE 1重组质粒送Invitrogen公司进行测序。将测序结果与GenBank网站提供的序列进行比对分析,结果显示连接的重组质粒没有突变(图10)。

2.3 p EGFP-TERE1重组质粒转染T24细胞,观察蛋白表达定位

本研究构建的pEGFP-TERE1重组质粒转染膀胱癌细胞系T24,采用激光共聚焦显微镜观察pEGFP-TERE1重组质粒蛋白表达定位(见图11)。图中显示pEGFP-TERE1重组质粒能在T24膀胱癌细胞系中表达,且定位在细胞浆中,胞核中没有表达。

3 讨论

TERE1/UBIAD1作为新发现的与肿瘤及脂代谢相关的基因,引起了肿瘤相关研究领域的广泛关注。TERE1/UBIAD1/Heix与肿瘤、脂代谢相关。膀胱移行上皮肿瘤、前列腺肿瘤中检测到TERE1基因表达下调[1,4]。本研究已发现UBIAD1基因在果蝇中的潜在同源体Heixuedian(Heix)的突变[3]。根据研究报道及本实验结果,推测TERE1/UBIAD1可能作为连接肿瘤与脂代谢的桥梁。是否TERE1/UBIAD1作为潜在的异戊烯转移酶,也能异戊烯修饰Ras、Rab等分子,有待研究证实。因此,阐明TERE1/UBIAD1、脂代谢与肿瘤的关系及其机制,将为临床肿瘤诊断与治疗提供极大的帮助。

本研究采用生物信息学分析TERE1/UBIAD1蛋白质结构与功能及序列比对与分子进化。4种生物信息学软件对TERE1蛋白2级结构跨膜结构预测分析结果显示在第80~105位氨基酸、第131~153位氨基酸、第156~180、第242~267位氨基酸、第313~334位氨基区域,4种软件均一致预测其为按顺序排列的跨膜部分,结构保守。SOSUI和TMPRED预测TERE1为8次跨膜蛋白。ANDREW ORR分析TERE1/UBIAD1蛋白在第58~333位残基间含有异戊烯转移酶功能域,且SCCD家系分析UBIAD1有5个突变位点N102S、D112G、R119G、T175I、N232S均位于此异戊烯转移酶功能域中[5]。

UBIAD1蛋白因跨膜形成在空间上3个环(Loop 1,Loop 2,Loop 3),这些环所在的氨基酸残基有相互作用。目前已发现的SCCD疾病UBIAD1基因突变位点有11个,其中N10S、D112G、D118G、R119G位于UBIAD1蛋白跨膜结构的Loop 1中,L121F、S171P、T175I、G177R、G186R位于UBIAD1蛋白跨膜结构的Loop 2中,N232S、D236E位于U-BIAD1蛋白跨膜结构的Loop 3中。研究表明在大肠杆菌menA和不同物种(包括人类)的UBIAD1蛋白结构的Loop 1含有聚法尼基双磷酸(polyprenyldipho sphate binding sites)结合位点(配体结合位点)。而且在人、大鼠、鸡、青蛙和河豚中这个配体结合位点序列100%同源[7,8]。本研究进一步预测分析了UBI-AD1蛋白跨膜结构Loop 1的空间结构,其中D106、N102、D112、D118、R119、L121等位点氨基酸高度保守(结果未显示)。UBIAD1基因N10S、D112G、D118G、R119G位点的突变正是在配体结合区,这个高度保守的区域提示SCCD疾病可能因异常的配体结合引起。但是是否UBIAD1基因的突变能激活或抑制UBIAD1基因的功能并不清楚。

本研究进一步选择UBIAD1蛋白最保守的区域loop 2和loop 3之间的区域采用PROSITE软件进行蛋白一致性结构预测。分析结果显示UbiA类异戊烯转移酶家族(PS00943)具有一致性序列,其序列模式为:N-x(3)-[DEH]-x(2)-[LIMFYT]-D-x(2)-[VM]-x-R-[ST]-x(2)-R-x(4)-[GYNKR](其中X表示任意氨基酸)。此区域是异戊烯化转移酶家族成员蛋白结构最保守的位置。有许多氨基酸的突变集中在此结构。如L121F、S171P、T175I、G177R、G186R UBIAD1突变位于蛋白跨膜结构的Loop 2中,N232S、D236E突变位于UBIAD1蛋白跨膜结构的Loop 3中。提示UBIAD1蛋白的3个环Loop 1,Loop 2,Loop 3部分可能需要形成3级结构,有助于实现适当的功能发挥一定的活性作用[9,10]。

所有已知的SCCD疾病UBIAD1蛋白的突变均位于蛋白跨膜的一侧(图1 3个环所在的一侧),而其他亲水的跨膜和疏水部分的结构残基在不同家族是可以变化的,其形成原因并不清楚。UBIAD1蛋白的突变是否影响了蛋白的正确折叠?突变的蛋白不能行使正确的功能,是否滞留在内质网中或被降解?正常的UBIAD1和突变的UBIAD1蛋白准备定位及蛋白运输如何?有研究报道了UBIAD1和载脂蛋白E有相互作用,然而突变的UBIAD1是否也影响了两者之间的相互作用?需要进一步的实验阐明以上问题。

为进一步实验证明UBAD1/TERE1与功能的关系,本研究成功构建绿色荧光蛋白-移行上皮反应基因全长(pEGFP-TERE1)真核表达质粒,转染膀胱癌细胞系T24,激光共聚焦显示TERE1主要在细胞浆中表达。同时本校生命科学院合作团队构建了TERE1-Myc真核表达质粒,并转染另一种细胞激光共聚焦显示TERE1主要在细胞质中表达,细胞核中未见。目前正在进一步实验证明TERE1在细胞器中的准确定位,如内质网、高尔基复合体等细胞器,为阐明TERE1和脂代谢的关系奠定基础。在膀胱癌细胞中过表达TERE1,检测其对细胞生长的影响及对细胞信号通路的影响,此部分实验正在进行。

为阐明UBAD1/TERE1的功能,下一步设想采取分段克隆的方式构建UBAD1/TERE1不同片段的真核表达质粒,分别将其转染如细胞系,检测其对细胞生长和对Ras-MAPK信号通路的影响。

参考文献

[1]M CGRAVEY TW,NGUYAEN T,TOMASZEWSKI JE,et al.Isolation and characterization of the TERE1 gene,a genedown-regulated in transitional cell carcinoma of the bladder[J].Oncogene,2001,20:1042-1051.

[2]WEISS JS,KRUTH HS,KUIVANIERNI H,et al.Mutations inthe UBIAD1 gene on chromosome short arm 1,region 36,causeSchnyder crystalline corneal dystrophy[J].Invest Ophthalmol VisSci.,2007,48(11),5007-5012.

[3]HONG L.RUBIN GM.“L(2)35Fc,a novel transmembrane proteinrequired for suppression of melanotic tumors”.39th AnnualDrosophila Research Conference,1998,March 25 to 29,Wash-ington,DC.Page 128.

[4]YELLORE VS,KHAN MA,BOURLA N,et al.Identification ofmutations in UBIAD1 following exclusion of coding mutations inthe chromosome 1p36 locus for Schnyder crystalline corneal dys-trophy[J].Mol Vis,2007,13,1777-1782.

[5]ORR A,DUBE MP,MARCADIER J,et al.Mutations in the U-BIAD1 Gene,encoding a potential prenyltransferase,are causalfor schnyder crystalline corneal dystrophy[J].PlosOne,2007,8,e685:1-10.

[6]XIA Y,HONG L.TERE1/UBIAD1,a bridge between lipidmetabolism and carcinogenesis[J].International Symposium onLipid and Tissue Injury,2009,11:75.

[7]KRYCER JR,KRISTIANA I,BROWN AJ.Cholesterol homeosta-sis in two commonly used human prostate cancer cell-lines,LNCaP and PC-3[J].PLoS One,2009,4(12):8496.

[8]SUVARNA K,STEVENSON D,MEGANATHAN R,et al.Menaquinone(vitamin K2)biosynthesis:Localization and charac-terization of the menA gene from Escherichia coli[J].J Bacteriol,1998,180:2782–2787.

[9]WEISS JS,KRUTH HS,KUIVANIERNI H,et al.Genetic analy-sis of 14 families with Schnyder crystalline corneal dystrophy re-veals clues to UBIAD1 protein function[J].Am J Med Genet A.2008,146(3):271-283.

结构基因 篇9

1 猪瘟病毒基因组结构

猪瘟病毒粒子呈圆形, 直径为34~50nm, 外部被脂蛋白的囊膜包裹, 内部为二十面体的对称核衣壳, 核心直径大约30nm。核衣壳内包裹单股正链线性RNA分子, 基因组大约12.5kb。5’端UTR长度为373nt或374nt, 有茎环、发卡等复杂的二级结构, 无甲基化帽子结构。5’端UTR与病毒的复制和翻译都密切相关。3’端UTR长度为215~239nt, 无poly (A) 尾巴结构, 在所有瘟病毒中高度保守, 其参与病毒基因组的复制、多聚蛋白的翻译和病毒粒子的装配。猪瘟病毒的ORF翻译一个3898个氨基酸的多聚蛋白。该蛋白在细胞内蛋白酶和病毒特异性的蛋白酶作用下裂解成各种成熟的结构蛋白 (S) 和非结构蛋白 (NS) 。从N端开始至C端各蛋白质分别是Npro、C、Erns、E1、E2、p7、NS2、NS3、NS4A、NS4B、NS5A和NS5B。

1.1 结构蛋白及其功能

1.1.1 C蛋白

C蛋白也称p14, 是病毒的核衣壳蛋白, 由多聚蛋白上Ser169~Ala267之间的氨基酸组成, 分子量为14kDa。在瘟病毒, C蛋白是主要区域中极为保守的蛋白, 同源性大于91%。C蛋白N端由Npro的水解作用而产生, C端可能是由宿主细胞的信号肽酶作用所致。C蛋白在合成后几分钟便与基因组RNA相结合, 包装形成核衣壳, 除此之外, 还在病毒繁殖和基因表达调控中有着重要作用。但是以C基因为基础构建的重组痘苗病毒活载体疫苗免疫猪, 不能诱导机体产生中和性抗体, 无法保护猪免受强毒的攻击。

1.1.2 Erns蛋白

Erns蛋白由病毒ORF Glu268~Ala494之间的227个氨基酸残基组成, 是一种高度糖基化的蛋白。分子量大小依据糖基化程度的不同而不同, 为44~48kD, 糖蛋白分子量约占Erns总蛋白分子量的二分之一, 去糖基的蛋白骨架分子量约为25.7kDa。Erns囊膜糖蛋白位于病毒粒子表面, 以分子量为100kD的同源二聚体的形式存在, 没有跨膜区, 只存在于黄病毒科的瘟病毒属。在感染细胞中, Erns积累于内质网, 存在于病毒粒子表面或被分泌到胞外, 是唯一可以分泌到感染细胞培养上清液中的糖蛋白。Erns既是一个结构蛋白又是一种功能蛋白, 对病毒的免疫、识别、吸附和进入宿主细胞十分重要。它可诱导机体产生中和抗体, 用其免疫猪可诱导产生对致死剂量的保护性免疫反应, 也是病毒粒子吸附进入易感细胞的必须蛋白。Erns还具有RNA酶活性, 对病毒宿主和细胞嗜性、致病性、细胞凋亡等方面起重要作用。

1.1.3 E1蛋白

E1糖蛋白由病毒ORF上Leu495~Gly689之间195个氨基酸组成, 分子量约33KD。在CSFV感染细胞的抽提物中, E1与E2以异源二聚体的形式存在, 目前还未发现病毒免疫血清中有抗E1的抗体。关于其蛋白的研究很少, E1不能诱导机体产生中和抗体, 在病毒中, E1-E2复合物可能是稳固病毒颗粒构型的主要结构蛋白。同时, 动物实验说明E1蛋白对猪瘟病毒的繁殖有重要作用, 但作用机制不明了。

1.1.4 E2蛋白

E2糖蛋白由ORF690~1060位编码的370个氨基酸残疾组成, 根据糖基化程度的不同, 分子量在51~55ku之间内变动。它位于病毒囊膜表面, 参与病毒的感染过程, 是猪瘟病毒的编码蛋白中最不保守的一种蛋白, 但是猪瘟病毒的最主要保护性抗原, 能诱导机体产生中和抗体。在靠近E2蛋白N端上游有一段信号肽序列, 在其C端一侧含有1个约由18个氨基酸组成的疏水侧链, 可形成跨膜结构蛋白TMP。E2蛋白是病毒宿主细胞识别、吸附的主要蛋白。Wensvoort等[2]的研究表明, E2蛋白的抗原区主要集中在蛋白分子的N端区域690aa~866aa, 包含4个抗原结构域, 即A、B、C、D。E2的C端有一段核心序列为YYEP (995~998aa) , 存在于一个线性表位中, 该表位被认为是瘟病毒共有的抗原表位。序列TAVSPTTLR (829~837aa) 表位在猪瘟病毒中高度保守, 可以作为鉴别牛病毒性腹泻病毒和羊边界病病毒的依据。

1.2 非结构蛋白

1.2.1 Npro蛋白

Npro蛋白, 也称p23, CSFV的非结构蛋白, 是ORF编码的多聚蛋白中N端的第一个蛋白质, 它由168个氨基酸组成, 具有蛋白质水解酶活性, 能以自我催化的方式从正在翻译的多聚蛋白上断裂下来, 成为成熟的病毒蛋白。Npro不参与CSFV的结构及非结构蛋白的加工过程, 其蛋白酶活性在CSFV增殖过程中的作用还不清楚。Rumenapf[3]等人使用定点突变技术对参与Npro催化活性的氨基酸残基进行测定, 确定了其中的GIu22、His49和Cys69是保持Npro蛋白酶活性所必需的氨基酸残基。

1.2.2 p7蛋白

p7蛋白位于结构蛋白E2和NS2之间, 是多聚蛋白上结构蛋白和非结构蛋白间一个连接肽。它的分子量约为7kDa, 主要由疏水性氨基酸组成, 存在于所有瘟病毒中。Gu B等在研究中发现, 将突变引入BVDV的感染性c DNA中, 框内缺失全部的p7不影响RNA复制, 但产生的病毒粒子无感染性;用辅助病毒对p7进行反式互补后, 又可获得感染性病毒。这一结果提示, 瘟病毒p7对产生感染性子代病毒是必需的。

1.2.3 NS蛋白

NS2-3蛋白也是CSFV中一个非结构蛋白, 所有感染猪瘟的动物体中均产生NS2-3的抗体, 但NS2-3不具有病毒中和性, NS2-3蛋白为双功能蛋白, 具有丝氨酸蛋白酶活性、核苷三磷酸酶活性及解旋酶活性, 其解旋作用依赖于CSFV特异的单链RNA, 该蛋白在病毒的生命周期中至关重要。还有其他一些非结构蛋白, 比如NS4A和NS4B、NS5A和NS5B这些非结构蛋白的研究还不多, 其中NS5B也与病毒复制有关。

2 猪瘟病毒蛋白表达技术

2.1 原核表达

在各种表达系统中, 最早被采用进行研究的是原核表达系统, 这也是目前掌握最为成熟的表达系统。该项技术的主要方法是将已克隆入目的基因DNA片段的载体 (一般为质粒) 转化细菌 (通常选用的是大肠杆菌) , 通过IPTG诱导并最终纯化获得所需的目的蛋白。其优点在于能够在较短时间内获得基因表达产物, 而且所需的成本相对比较低廉。但与此同时原核表达系统还存在许多难以克服的缺点:如通常使用的表达系统无法对表达时间及表达水平进行调控, 有些基因的持续表达可能会对宿主细胞产生毒害作用, 过量表达可能导致非生理反应, 目的蛋白常以包涵体形式表达, 导致产物纯化困难;而且原核表达系统翻译后加工修饰体系不完善, 表达产物的生物活性较低。

目前, 猪瘟病毒基因原核表达常采用pET-32a作为载体导入宿主大肠杆菌中。汤德元等[4]在表达贵州流行株E2基因时, 将酶切得到的E2基因片段克隆到pET-32a (+) 原核表达载体上, 后转化至宿主菌大肠杆菌BL21中。经诱导, 目的蛋白以包涵体的形式存在。通过进一步的提取纯化, 加入弗氏佐剂免疫小鼠, 产生了一定的抗体水平。猪瘟病毒抗体的间接ELISA方法的初步建立也常采用原核表达。蒋大良[5]和谢金文[6]都是采用pET-32a作为原核表达的载体来建立间接ELISA方法, 但是他们都是将重组质粒导入大肠杆菌Rosetta (DE3) 中。该菌株通过一个相容性氯霉素抗性补充密码子的tRNAs, 从而避免大肠杆菌密码子使用频率导致的表达限制, 而使目的蛋白获得高效表达。

2.2 真核表达

为克服原核表达的不足, 许多学者将原核基因调控系统引入真核基因调控领域。因此, 利用真核表达系统来表达目的蛋白越来越受到重视。目前, 基因工程研究中常用的真核表达系统有酵母表达系统、昆虫细胞表达系统和哺乳动物细胞表达系统。

2.2.1 甲醇酵母表达

甲醇酵母基因表达系统是一种最近发展迅速的外源蛋白质生产系统。甲醇酵母是可利用甲醇作为唯一碳源的酵母, 它具有真核生物的蛋白质加工、折叠、翻译后修饰的优点, 同时其遗传比较稳定、能高密度发酵、蛋白表达量高、易于纯化。酵母主要有H.Polymorpha、Candida Bodinii和Pichia Pastoris三种, 其中Pichia Pastoris作为基因表达系统使用得最多、最广泛。与以往的基因表达系统相比, 它具有无可匹敌的高表达特性, 已被认为是最具有发展前景的生产蛋白质的工具之一。李艳蕊等[7]利用毕赤酵母表达载体pPIC9K, 将猪瘟病毒Erns基因片段导入GS115酵母菌中。结果显示该阳性重组菌经甲醇诱导后, 在培养液上清中可检测到目的蛋白, 且目的蛋白能特异识别猪瘟抗体, 具有很好的反应原性。

2.2.2 昆虫细胞表达

现在, 昆虫细胞与杆状病毒协同的表达系统越来越被广泛应用于科研和工业生产领域。与其他常用的重组蛋白表达系统相比, 昆虫杆状病毒表达系统具有其独特的优点:它与其他真核表达系统相比, 外源基因表达水平高, 特别是细胞内蛋白。在大多数情况下, 表达的重组蛋白可溶, 折叠正确, 有翻译后修饰 (如糖基化等) , 有生物学活性, 比较容易分离纯化;昆虫细胞悬浮生长, 容易放大培养, 有利于大规模表达重组蛋白;易于表达异源多聚体蛋白, 可通过多种重组病毒同时感染昆虫细胞或用含有多个表达框的一种病毒感染昆虫细胞来实现;具有良好的安全性, 昆虫杆状病毒不感染脊椎动物。周向阳等[8]利用昆虫-杆状病毒表达系统成功的将外源基因E2高效表达, 目的产物能被抗E2蛋白的单克隆抗体2B10和6×His-单克隆抗体特异性识别, 且具有良好的免疫原性。为了及时监控蛋白表达情况以及便于优化表达条件, 陈柳等[9]将猪瘟病毒Erns基因与绿色荧光蛋白基因 (GFP) 融合, 用昆虫-杆状病毒表达系统高效表达了Erns-GFP融合蛋白, 省去了常规的烦琐费时的蛋白表达检测, 从而加快了实验进程并节约了成本。

2.2.3 哺乳动物细胞表达

由于在原核细胞中真核基因不能进行内含子的自我剪接, 表达的蛋白质不能进行翻译后加工, 不能进行正确折叠, 使表达产物量少, 活性低, 因此目前倾向于用哺乳动物细胞表达系统表达大部分基因 (当然也包括在昆虫细胞以及酵母细胞中, 不过从使用频率上看还是哺乳动物细胞居多并且更为实用) 。哺乳动物细胞表达真核基因应注意的问题: (1) 根据研究目的选择合适的载体-宿主表达系统。哺乳动物表达系统分为瞬时与稳定表达系统两类。瞬时表达系统用于根据产物活性来证实分离基因, 从cDNA文库中筛选基因, 诱变对蛋白质生物活性与功能的影响的分析等研究;稳定表达系统用于大量生产蛋白质产品。 (2) 选择合适的细胞系。不同的培养细胞系摄取和表达外源基因的能力相差非常大, 同一基因在一种细胞系上有效, 但在另一种细胞系中可能完全不表达。杨玉艾等[10]将猪瘟病毒Erns-E2融合基因定向亚克隆于穿梭载体中, 构建了携带Erns-E2基因的重组腺病毒转移载体质粒pAdEasy-Erns-E2, 经酶切后转染人胚胎肾细胞 (HEK293) , 成功包装出重组腺病毒rAd-Erns-E2。免疫动物实验结果表明, rAd-Erns-E2能使免疫猪抵抗猪瘟病毒强度攻击, 为进一步研制猪瘟基因工程疫苗提供了实验依据。

2.3 原核表达兼真核表达

伤寒沙门氏菌是细胞内侵袭性致病菌, 具有靶向感染专职抗原提程细胞 (APC) 和肠道感染的特点, 因而作为疫苗或基因治疗载体很有发展潜力。当前已构建出许多对小鼠乃至人类有保护作用的减毒鼠伤寒沙门氏菌菌株, 表达多种病原微生物抗原 (包括细菌、病毒、寄生虫等的保护性抗原的重组减毒伤寒沙门氏菌在几种动物模型中, 能够有效诱导粘合和全身性免疫应答。减毒沙门氏菌不仅可以以原核方式表达外源抗原, 亦可运送以真核表达方式构建的核酸疫苗。西北农林科技大学的许信刚教授等[11]将构建的重组质粒pYA3341-E2电转入鼠伤寒沙门氏菌疫苗株X4550 (缺失asd、cya、crp基因) , 获得重组疫苗菌株X4550 (pYA3341-E2) 。结果显示, 重组菌能表达E2蛋白, 且表达的蛋白能与猪瘟病毒阳性血清特异性结合。在体外营养选择压力下, 重组菌株可稳定地携带重组质粒传代繁殖, 在体内可稳定地定居于肠系膜淋巴结和脾。小鼠口服试验证实重组菌无毒性, 安全可靠。动物免疫试验和淋巴细胞增殖试验表明, 成功构建了能稳定表达猪瘟病毒E2蛋白的口服减毒鼠伤寒沙门氏菌疫苗株。

3 结语

由于猪瘟传染性强, 致死率高, 给养猪业造成巨大的经济损失。近年来, 国内外学者对猪瘟防控研究已经取得了较大进展, 特别是许多国家采取了大规模的疫苗防控和净化措施。但是, 现阶段疫苗的广泛使用促使病毒变异, 加之病毒造成的免疫抑制, 使得猪瘟在全球仍是常发疫病之一。因此, 进一步的搞清猪瘟的分子生物学特征, 研究出更好的蛋白表达技术为检测服务, 才是防控工作的重中之重。

摘要:猪瘟是威胁许多国家包括我国在内的养猪业的重要疾病之一, 随着猪瘟病毒 (CSFV) 的突变性发展, 从分子水平探索CSFV基因组及蛋白结构及功能, 可以为预防猪瘟流行和爆发做好准备。同时, 加强猪瘟病毒诊断中各技术的研究对预防和控制本病具有非常重要的现实意义。本论文对猪瘟病毒基因组结构和诊断技术中的蛋白表达技术进行了系统的阐述。

关键词:猪瘟病毒,基因组结构,蛋白表达技术,技术应用,研究进展

参考文献

[1]Zhou T, Progress of classical swine fever virus and the preventionof the disease[J].Chinese J.Vet.Sci.Technol, 1980, 4:23–33.

[2]Wensvoort Gl.Topographical and functional mapping of epitopes on hog cholera virus with monoclonal antibodies[J].J Gen Virol, 1993, 74:2053-2060.

[3]Tratschin JD, Moser C, Ruggli N, et al.Classical swine fever virus leader proteinase Npro is not required for viral replication in cell culture[J].J Virol, 1998, 72 (9) :7681-7684.

[4]汤德元, 李春燕, 罗险峰, 等.猪瘟病毒贵州流行株E2基因原核表达及其免疫原性的研究[J].畜牧兽医学报, 2011, 42 (11) :1649-1653.

[5]蒋大良, 余兴龙, 李润成, 等.猪瘟病毒NS3基因克隆、原核表达及间接ELISA方法初步建立[J].微生物学通报, 2010, 37 (1) :78-84.

[6]谢金文, 李娇, 董林, 等.猪瘟病毒E2基因原核表达及间接ELISA检测方法的初步建立[J].中国兽医杂志, 2011, 47 (3) :28-30.

[7]李艳蕊, 李学伍, 王丽, 等.猪瘟病毒Erns蛋白在毕赤酵母中的表达及鉴定[J].湖南农业学报, 2010, 134 (5) :130-133.

[8]周向阳, 万婧, 廖迅, 等.猪瘟病毒石门株E2蛋白在杆状病毒系统中的表达[J].动物医学进展, 2012, 33 (1) :28-32.

[9]陈柳, 余斌, 云涛, 等.具有荧光标签的猪瘟病毒Erns蛋白在杆状病毒表达系统中的表达[J].华北农学报, 2011, 26 (1) :26-30.

[10]杨玉艾, 初晓辉, 毕保良, 等.猪瘟病毒E0和E2蛋白融合表达的重组腺病毒构建及免疫保护性研究[J].中国预防兽医学报, 2010, 32 (6) :419-423.

结构基因 篇10

1 材料与方法

1.1 材料

所有试验犬(棕黑色系、黑色系、棕色系)均来自内蒙古呼伦贝尔、兴安盟地区。每个品种随机取20只犬(公、母各10只),静脉采血2 mL,另加ACD抗凝(1∶5),用冰块保存带回公安部南京警犬研究所分子生物学实验室,-20 ℃贮藏,备用。按照常规的酚/氯仿/异戊醇法提取犬基因组DNA。

TaqDNA聚合酶、dNTP,购自TaKaRa公司;丙烯酰胺三羟甲基氨基甲烷(Tris),进口分装产品;N,N-甲叉双丙烯酰胺,购自瑞士Fluka公司; PBR322/Msp Ⅰ Marker,华美生物工程公司生产;蛋白酶K、苯酚、无水乙醇等常规试剂,均为国产分析纯。

1.2 方法

1.2.1 微卫星引物

研究所采用的引物及退火温度见表1,各位点的引物序列参见参考文献[1,2]。

1.2.2 PCR扩增反应

PCR扩增体系:ddH2O 4.55 μL,10×Buffer 1 μL,4 dNTPs(2.5 mmol/L)0.8 μL,MgCl2 (25 mmol/L)1 μL,引物R、F(10 pmol/μL)分别为0.3 μL和0.25 μL,TaqDNA聚合酶(5 U/μL)0.1 μL,DNA模板1 μL。PCR扩增程序:94 ℃预变性3 min; 94 ℃变性30 s ,64 ℃复性30 s,72 ℃延伸30 s,共35个循环;72 ℃再延伸10 min。其中变性温度因引物的不同而不同。扩增结果经12%凝胶电泳5 h,银染后观察结果,并用GIS2700D凝胶成像系统拍照。

1.3 统计分析

1.3.1 遗传多样性计算

利用GENEPOP软件[3]计算等位基因数(Ne),观察期望杂合度(He)。根据Botstein D等[4]的公式计算每个群体每个座位的多态信息含量(PIC)。

1.3.2 遗传分化系数的计算

根据FSTAT程序[5]计算F-统计量中的固定系数(亚群内个体固定系数Fis和整个群体固定系数Fit),品种间F-统计量的FST值则通过GENEPOP软件[3]算得。

1.3.3 基因迁移率(Nm)的计算

迁移率即群体间每代繁殖成功的迁移数,由公式Nm = 0.25(1-FST)/FST[6]计算获得。

2 结果与分析

2.1 微卫星标记的扩增和电泳

对所选用的8个微卫星扩增产物进行聚丙烯酰胺凝胶电泳后,微卫星的电泳带型清晰、明显。图1为微卫星标记DR2的部分检测结果。

1~8.基因型分别为BD、EF、AB、CD、EF、CD、AB、AB;M.PBR322/ Msp Ⅰ Marker;9~13.基因型分别为EB、EF、AB、AB、EB。

2.2 品种( 类群) 内的遗传变异

不同微卫星座位的遗传多样性与其自身及所在特定群体的遗传特性有关。试验对所选用的8个微卫星座位在3个蒙古犬品系间表现出的特性即有效等位基因数、期望杂合度、多态信息含量等进行了统计分析,结果见表2。

2.3 品种(类群)间的遗传变异

通过每个座位F-统计量的固定系数以及基因迁移率来检验群体间的遗传分化程度,分析结果见表3。

对各微卫星基因座进行F-统计量计算,F-统计量中的 Fis和Fit可以是正值,也可以是负值,而FST总是正值。FST则表示随机抽取每个亚群体2个配子间的相互关系,它用来测量亚群体间的遗传分化程度。当品种间没有分化时FST=0,而当FST=1时说明品种间的等位基因完全不同。Fit表示将3个犬种作为一个单位考虑时,某位点上基因型偏离Hardy-Weinberg期望比例的程度;Fis表示亚群体中基因型偏离Hardy-Weinberg期望比例的程度。Fis为正值表示近交,杂合度缺失;Fis为负值表示远交,杂合度过量。基因座ZuBeCa57、ZuBeCa61、MAOA、DR2、5-HTT和133的Fis值均为负值,表明这些座位上的杂合体比率大于期望值,即杂合子过剩,群体间的基因和基因型分化显著,即等位基因及其基因型在群体间的分布不同。FST的变化范围为0.131 4~0.355 5,平均值为0.218 3。群体每代迁移数即基因流是指任何携带有遗传物质的个体(或载体)在种群内和种群间的流动,可以利用微卫星标记对种群间的基因流进行分析。Nm变化范围为0.453 2~1.653 2,平均值为1.023 4。从FST和Nm值可知,FST值越大,Nm值越小,即品种分化程度越大,基因流越小。

3 讨论

3.1 关于品种(类群) 内的遗传变异

遗传杂合度反映各群体在基因座位上的遗传变异。试验选择的3个蒙古犬品系的杂合度为0.561 4~0.677 0,说明这3个蒙古犬品系的变异程度都较高。多态信息含量是衡量片段多态性另一个较好的指标[7]。微卫星的多态性水平常用多态信息含量和杂合度来表示,多态信息含量高、杂合度大说明群体内基因型一致性差、遗传变异大、选择潜力大,应用于动物遗传育种研究效果就好;反之,多态信息含量低、杂合度小说明群体内遗传变异小,选择潜力也小,应用于动物遗传育种的效果就差。Botstein D等[4]提出了衡量基因变异程度高低的多态信息含量指标:当PIC > 0.5时,该基因座位为高度多态基因座位;当0.25 < PIC< 0.5时,该基因座位为中度多态基因座位;当PIC < 0.25时,则该基因座位为低度多态基因座位。本研究所选的8个微卫星座位均表现出了高度多态性,可作为犬的多态标记。

3.2 关于品种(类群)间的遗传变异

F-统计量是衡量群体遗传分化程度的指标,可以分别对群体内、群体间和总群体的实际分化程度进行统计分析。群体的固定系数FST < 0.05,群体分化程度较小;0.05 < FST < 0.15,群体分化程度中等;0.15 < FST < 0.25,群体分化程度较大;0.25 < FST < 1.00,群体分化程度很大[5]。本试验测得的FST为0.131 4~0.355 5,平均值为0.218 3,显示3个犬品系的遗传分化程度较大。分析其主要原因是各个品系来自于不同的地区,由于地域及选种选育方式的差异,经过长期的累积导致了种内不同品系间出现一定程度的分化。这种品系内分化的存在对品种结构的形成及保持品种内遗传多样性具有积极的意义。

迁移率表示每代的迁移数,是测定基因流的一种方法。基因流会影响群体间的相似性或特长,会使出现在一个群体中的基因带给另一个群体,基因流越大,即Nm值越大,群体间遗传结构的相似性越大[8]。本试验得到的迁移率Nm在0.453 2~1.417 8之间变动,平均值为1.023 4,说明3个蒙古犬品系间在这8个微卫星座位上的遗传结构存在一定程度的相似性。群体遗传学研究认为,引起群体分化的主要原因是遗传漂变和自然选择的作用[9]。Wright S[10]认为,若群体间基因流大于1,能发挥均质化作用,即能有效抑制由遗传漂变而引起的遗传分化。在本试验中,基因流较大,从而可以排除遗传漂变的作用。因此,品系间相似的遗传结构可能和品种的形成史有关。

摘要:为了在分子水平上分析蒙古犬群体结构,试验以蒙古犬3种毛色类型群体为试验动物,对其基因组中的微卫星结构进行分析,研究其群体的微卫星多态性。结果表明:8个微卫星位点在3个蒙古犬品系中均呈现高度多态,由相关公式计算的平均杂合度、群体多态信息含量分别为0.5614~0.6770和0.5030~0.6171;3个品系间的基因遗传分化系数为0.2183,群体分化程度较大;迁移率在0.4532~1.4178之间变动,平均值为1.0234。说明3个蒙古犬品系8个微卫星基因座的遗传结构存在一定程度的相似性,分析其品系间相似的遗传结构可能与品种的形成史有关。

关键词:蒙古犬,微卫星,多态,遗传分化

参考文献

[1]李彩霞,凌凤俊,涂政.犬的三个STR基因座遗传多态性[J].动物医学进展,2002,23(5):80-81.

[2]李小慧.犬主要行为性状及其相关基因的研究[D].南京:南京农业大学,2006.

[3]RAYMOND M,ROUSSE F.Population genetics software for exact test and ecumenicism[J].Journal of Heredity,1995,86:248-249.

[4]BOTSTEIN D,WHITE R,SKOLNICKM.Construction of a genetic linkage map in man using restriction fragment length polymorphisms[J].Am J Hum Genet,1980,32:314-331.

[5]GOUDET J.FSTAT version[D].Switzerland:University of Lau-sanne,2002:29-32.

[6]SLATKIN M,BARTON N H.A comparison of three indirect meth-ods for estimating average levels of gene flow[J].Evolution,1989,43:1349-1368.

[7]贾斌,赵宗胜,李大全,等.新疆3个地方品种绵羊微卫星遗传分析[J].石河子大学学报:自然科学版,2005,4(2):194-199.

[8]PARKER HG,KIML V,SUTTER NB,et al.Genetic structure of the purebred domestic dog[J].Science,2004,304:1160-1164.

[9]ZHENG X ZH,XUHF,LUHJ.Research progress on population genetic heterogeneity[J].Biodiversity,1997,5(3):210-216.

上一篇:火烧圆明园始末下一篇:通路组织