生物信息学重点

2024-04-14

生物信息学重点(通用6篇)

篇1:生物信息学重点

1.生物信息学:生物信息学包含了生物信息的获取、处理、分析、和解释等在内的一门交

叉学科;它综合运用了数学、计算机学和生物学的各种工具来进行研究;目的在于阐明大量生物学数据所包含的生物学意义。

2.BLAST直译:基本局部排比搜索工具意译:基于局部序列排比的常用数据库搜索工

具含义:蛋白质和核酸序列数据库搜索软件系统及相关数据库

3.PSI-BLAST:是一种迭代的搜索方法,可以提高BLAST和FASTA的相似序列发现率。

4.一致序列:这些序列是指把多序列联配的信息压缩至单条序列,主要的缺点是除了在特

定位置最常见的残基之外,它们不能表示任何概率信息。

5.HMM隐马尔可夫模型:是蛋白质结构域家族序列的一种严格的统计模型,包括序列的匹

配,插入和缺失状态,并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。

6.信息位点:由位点产生的突变数目把其中的一课树与其他树区分开的位点。

7.非信息位点:对于最大简约法来说没有意义的点。

8.标度树:分支长度与相邻节点对的差异程度成正比的树。

9.非标度树:只表示亲缘关系无差异程度信息。

10.有根树:单一的节点能指派为共同的祖先,从祖先节点只有唯一的路径历经进化到达其

他任何节点。

11.无根树:只表明节点间的关系,无进化发生方向的信息,通过引入外群或外部参考物种,可以在无根树中指派根节点。

12.注释:指从原始序列数据中获得有用的生物学信息。这主要是指在基因组DNA中寻找基

因和其他功能元件(结构注释),并给出这些序列的功能(功能注释)。

13.聚类分析:一种通过将相似的数据划分到特定的组中以简化大规模数据集的方法。

14.ESI电喷雾离子化:一种适合大分子如蛋白质离子化没有明显降解的质谱技术。样品溶

解后从高电压控制下的细针中喷出,形成的带电荷微小液滴从一个小孔直接进入质谱仪的真空室中,在其钟被一股惰性气体干燥形成气态离子,这些气态离子从分析仪向探测器加速(飞行)。

15.机制辅助的激光解析/离子化(MAIDI):这一技术通过质谱产生离子,这适合于没有降

解的大蛋白质的分析。基本原理是将分析物分散在机制分子中并形成晶体,当用激光照射晶体时,基质分子吸收激光能量,样品解吸附,基质-样品之间发生电荷转移使样品电子分离。

16.质谱(MS):是一种准确测定真空中离子的分子质量/电荷比(m/z)的方法,从而使分子质

量的准确确定成为可能。基本原理:将分析物分散在基质分子中并形成晶体,当用激光照射晶体时,基质分子吸收激光能量,样品解吸附,基质—样品之间发生电荷转移使样品分子电离。

17.微阵列芯片:将探针有规律地排列固定于载体上,与标记荧光分子的样品进行杂交,通

过扫描仪扫描对荧光信号的强度进行检测,从而迅速得出所要的信息。

18.虚拟消化:是在已知蛋白质序列和蛋白外切酶之类切断试剂的已知特异性的基础上,由

计算机进行的一种理论上的蛋白裂解反应。

19.分子途径是指一组连续起作用以达到共同目标的蛋白质。

20.虚拟细胞:一种建模手段,把细胞定义为许多结构,分子,反应和物质流的集合体。

21.先导化合物:是指具有一定药理活性的、可通过结构改造来优化其药理特性而可能导致

药物发现的特殊化合物。就是利用计算机在含有大量化合物三维结构的数据库中,搜索能与生物大分子靶点匹配的化合物,或者搜索能与结合药效团相符的化合物,又称原型物,简称先导物,是通过各种途径或方法得到的具有生物活性的化学结构

22.权重矩阵(序列轮廓):是一种描绘蛋白质结构域家族相序列的方法。它们表示完全

结构域序列,多序列联配中每个位点的氨基酸都有分值,并且特定位置插入或缺失的可能性均有一定的衡量方法。(课件定义)基础上针对特定的应用目标而建立的数据库。

23.系统发育学(phylogenetic):确定生物体间进化关系的科学分支。

24.系统生物学(systems biology):是研究一个生物系统中所有组分成分(基因、mRNA、蛋白质等)的构成以及在特定条件下这些组分间的相互关系,并分析生物系统在一定时间内的动力学过程

25.蛋白质组(proteome):是指一个基因组、一种生物或一个细胞/组织的基因组所表达的全套蛋白质。

26.进化树:物种的进化被表现成为一系列的分叉,并符合分类理论,这些树就叫做进化树。

27.DBGET/LinkDB:由日本的化学研究所和人类基因组中心所开发的在线数据检索工具。

也见Entrez,SRS。

28.肽指纹图谱:蛋白质注释的一种方法,用质谱技术确定肽分子量(由蛋白酶消化产生)

并用来搜索蛋白质数据库找到与“虚拟消化”蛋白质相匹配项。

29.E值:对某个已识别出的相似度值S,E值是分值大于等于S的期望频率,改值可以被

理解为期望随机得到等于S或大于S值的分值数目。

30.相似度表和距离表:使显示物种间一套选定字符的相关性的表格,采用匹配的百分比(相

似度表)或者差异的百分比(距离表)来表示。

31.无监督分析法:这种方法没有内建的分类标准,组的数目和类型只决定于所使用的算法

和数据本身的分析方法。有监督分析法:这种方法引入某些形式的分类系统,从而将表达模式分配到一个或多个预定义的类目中。

32.距离矩阵法:首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推到得

出分类群之间的进化距离,构建一个进化距离矩阵,其次基于这个矩阵中的进化距离关系构建进化树;最大简约法:该法依据在任何位置将一条序列转变成另一条序列所需要突变的最少数量对序列进行比较和聚类;最大似然法:该模型可将一个给定替代发生在序列中任何位置的概率融合进算法,该方法计算序列中每个位置的一个给定序列变化的可能性,最可靠的树为总的可能性最大的那棵。

33.一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理

和注释; 二级数据库:对原始生物分子数据进行整理、分类的结果,即非原始的实验数据,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。

1.常用的三种序列格式:NBRF/PIR,FASTA和GDE

2.三个核算序列数据库:GenBank,EMBL和DDBJ

3.蛋白质序列数据库:SWISS-PROT和TrEMBL

4.提供蛋白质功能注释信息的数据库:KEGG(京都基因和基因组百科全书)和PIR(蛋白质信息资源)5.目前由NCBI维护的大型文献资源是PubMed

6.数据库常用的数据检索工具:Entrez,SRS,DBGET

7.常用的序列搜索方法:FASTA和BLAST

8.高分值局部联配的BLAST术语是HSPs(高分值片段对),E(期望值)

9.多序列联配的常用软件:Clustal10.蛋白质结构域家族的数据库有:Pfam,SMART

11.系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法

12.系统发育树的构建方法:距离矩阵法,最大简约法和最大似然法

13.常用系统发育分析软件:PHYLIP

14.检测系统发育树可靠性的技术:bootstrapping和Jack-knifing

16.查找简单基因的程序:NCBI ORF finder

17.测试基因预测程序正确预测基因的能力的项目是GASP(基因预测评估项目)

18.二级结构的三种状态:α螺旋,β折叠和β转角

19.用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层和输出层

20.通过比较建模预测蛋白质结构的软件有SWISS——MODEL网站

21.蛋白质质谱数据搜索工具:SEQUEST(原理:经试验确定的肽或肽片段的质谱与数据库中预测的质谱进行匹配)。22.分子途径最广泛数据库:KEGG

23.Entrez搜索:PubMed的文献数据库MEDLINE。SRS搜索方式:标准搜索,扩展搜索。

1.FASTA序列格式: 第一行以“>”开头但并没有指明是蛋白质还是核酸序列。后跟代码,接着是注释(在同一行),通常注释要以“|”符号相隔,第一行没有长度限制。值得注意的是FASTA文件允许以小写字母表示氨基酸。文件扩展名为“.fasta”。

NBIR/PIR序列格式: 第一行以“>”开头,后面紧跟两字母编码(P1代表蛋白质序列,N1代表核酸),再接一个分号,分号后紧跟序列标识号。后面是说明行,该行可长可短,没有长度限制。接下来是序列本身,以“*”号终止。文件的扩展名为“.pir”或“.seq”。GDE序列格式: 与FASTA的格式基本相同,但行首为“%”,文件扩展名为“.gde”。)

2.BLAST的五个子程序(1)Blastp,用蛋白质查询蛋白质序列,可以找到具有远源进化关系的匹配序列,方法是用待搜索蛋白序列与蛋白数据库比较。(2)Blastn,用核苷酸 查询核苷酸序列,适合寻找分值较高的匹配,不适合远源关系,待搜索核酸序列与核酸数据库比较(3)Blastx,用蛋白质查询已翻译核苷酸序列,适合新DNA序列和EST序列的分析,将待搜索核酸序列按6个读框翻译成蛋白质序列,然后与数据库中的蛋白质比较。(4)Tblastn,用已翻译核苷酸查询蛋白质,适合寻找数据库中尚未标注的编码区,将数据库中核酸序列按6个读框翻译成蛋白序列,然后与待搜索蛋白序列对比。(5)Tblastx,用已翻译核苷酸查询已翻译核苷酸序列。适合分析EST序列,无论是待搜索核酸序列还是数据库中核酸序列,都按6个读框翻译成蛋白序列。

4.PSI-Blast的原理:是一种将双序列比对和多序列比对结合在一起的数据库搜索方法。其主要思想是通过多次迭代找出最佳结果。每次迭代都发现一些中间序列,用于在接下去的迭代中寻找查询序列的更多疏远相关序列(拓展了序列进化关系的覆盖面积)。具体做法是最初对查询序列进行BLAST搜索。接着把这次查找得到的每一击中项(高于选择的E值的选项)作为BLAST搜索第二次迭代的查询序列。第二次迭代应该找到比最初查询序列更多的进化关系,重复(迭代)这个过程直到找不到有意义的相似序列为止。

5明该树是可信的。第二,数据可以被重新取样,来检测他们系统上的重要性。在一种被称为bootsrapping的技术中,数据被随机从多序列联配的任何位置取样,接着被整合进入新的人工联配,这些联配之后通过构建树来检测。由于取样是随机的,一些位置可能被多次取样,而另一些则没由被取样过。Jack-knifing是一种和上述相似的过程,其中50%的原始数据被重新取样构成一个新的矩阵,再从该矩阵重新构建系统发育关系。

7. 原核生物和真核生物基因组中的注释所涉及的不同问题:在原核生物中,基因密度很高

(也就是说,只有很少的基因组DNA)并且绝大多数基因不含内含子。在真核生物中,基因密度下降并且由于物种自身复杂的增高而使基因复杂度也增高。因此,在高等真核生物基因组中寻找基因可能会非常困难。

9.预测蛋白质三级结构的三种方法 1)同源建模法:依据蛋白质与已知结构蛋白比对信息构建3D模型; 2)折叠识别法:寻找与未知蛋白最合适的模板,进行序列与结构比对,最终建立结构模型; 3)从头预测法:根据序列本身从头预测蛋白质结构。

11.先导化合物的来源有四种来源:1)通过偶然性观察发现的先导化合物(这个方法最

著名的例子就是亚历山大.弗莱明发现的青霉素,今天所用的许多抗生素皆由其发展出来)

2)也可以通过替代疗法的药物开发中发现的药物副作用来识别先导化合物(例如,镇定剂氯化物丙嫀是在试验中发现用在抗组胺剂时被发现的)3)先导化合物也可以来自传统医药学(如奎宁化合物就来自金鸡纳的树皮)4)先导化合物也可以来自天然的底物或是配体(比如说,肾上腺素作为舒喘宁的类似物用来治疗哮喘)

12.简述DNA计算机的基本原理: 1)以编码生命信息的遗传物质—DNA序列,作为信息编码的载体,利用DNA分子的双螺旋结构和碱基互补配对的性质,将所要处理的问题映射为特定的DNA分子;2)在生物酶的作用下,通过可控的生化反应生成问题的解空间;最后利用各种现代分子生物技术如聚合酶链反应RCR、超声波降解、亲和层析、分子纯化、电泳、磁珠分离等手段破获运算结果。.DNA计算机优点:低能耗、存储容量高、运算速度快,可真正实现并行工作。

13.简述DNA计算实现方式中,表面方式与试管方式相比具有哪些优点?

试管方式:就是在一个或多个试管的溶液里进行生化反应;

表面方式:是将对应的解空间的DNA分子固定在一块固体上,其次进行各种生化反应,或是在表面逐步形成解空间,然后根据具体问题对所有可能的解进行筛选,最后得到运算结果。优点:(1)操作简单,易于实现自动化操作;(2)减少人为操作过程中造成的DNA分子的丢失及其它操作失误;(3)减少分子在表面上的相互作用,同时增强分子间的特异性结合;(4)信息储存密度大,据估计,10毫克DNA表面上的储存密度是传统计算姬的10的8次方倍,而在溶液中仅为10的5次方倍;(5)结果易于纯化。

14.简述PCR引物设计的基本原则及其注意要点原则:首先引物与模板的序列要紧密互补,其次引物与引物之间避免形成稳定的二聚体或发夹结构,再次引物不能再模板的非等位点引发DNA聚合反应(即错配)。注意要点:

1、引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适合于TaqDNA聚合酶进行反应。

2、引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发几率增加。

3、引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。

4、引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。

5、引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有很多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(thenearestneighbormethod)。

6、G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端G值较低(绝对值不超过9),而在5’端和中间G值相对较高的引物。引物的3’端的G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。

7、引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。

8、对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。

15.假设你得到一段未知基因的DNA序列,从你学习到的生物信息学分析方法和软件,设

计一个分析流程来分析该未知基因的功能和家族类别(包括系统发育树构建)

1、得到未知基因的DNA序列,用Blast做序列比对,找出与其基因相似的核苷酸序列和蛋白质序列。

2、接着,用搜索出来的较相似的序列用ClustW进行多序列比对,得到该序列的保守情况和突变情况。

3、最后用距离法构建系统发育树。

16.假设你得到一段未知蛋白的氨基酸序列,从你学习到的生物信息学分析方法和软件,设计一个分析流程来分析该未知蛋白的功能和家族类别以及其结构预测。

1、用该序列进行BLASTP搜索。

2、再对其进行蛋白质结构域、功能域的搜索,可以用Znterproscan、Pfam,并对其进行结构分析。

3、再用ClustW进行多序列比对。

4、用人工神经网络的方法对其结构进行结构预测。

5.多序列联配的意义:

1)分析多个序列的一致序列;2)用于进化分析,是用系统发育方法构建进化树的初始步骤;

3)寻找个体间单核苷酸多态性;4)通过序列比对发现直亲同源与旁系同源基因;5)寻找同源基因(相似的序列往往具有同源性);6)寻找蛋白家族识别多个序列的保守区域;7)相似的蛋白序列往往具有相似的结构与功能;8)辅助预测新序列的二级或三级结构;9)可以直观地看到基因的哪些区域对突变敏感;10)PCR引物设计。

6.系统发育学的研究方法: 1)表现型分类法:将表型相像的物种归类在一起,所有特征都要被考虑到; 2)遗传分类法:具有共有起源的物种归类在一起,也就是说,这些字符并没有出现在离它们较远的祖先序列; 3)进化分类法:该方法综合了表现型分类法和遗传分类法的原理,进化方法被普遍认为是最好的系统发育分析方法,因为该方法承认并采用目前的进化理论;

8.简述人工神经网络预测蛋白质二级结构的基本步骤。

(1)输入数据(来自PDB)(2)产生一个神经网络(一个计算程序)(3)用已知的蛋白质二级结构来训练这个模型(4)由训练好的模型来给出未知蛋白的一个可能的结构

(5)最后从生物角度来检验预测的一系列氨基酸是否合理

10.分子途径和网络的特点:(1)分子途径和网络的结构随意性大。图可以很简单,也可以非常复杂。它们可能包含了多个分支,盘绕的连接和回路。(2)它们通常也显示出节点间关系的方向,例如表示出代谢通路或信号传导的方向。调控途径和网络的图也应该说明相互作用是正的还是负的。正的相互作用(促进或者活化作用)常常用箭头表示,而负的交互效应(抑制或者失活作用)常常用T型棒表示。

篇2:生物信息学重点

1、医学信息学:是研究生物医学信息、数据和知识的存储、检索并有效利用,以便在卫生管理、临床控制和知识分析过程中作出决策和解决问题的科学。

2、医学信息学的研究内容:医学信息、医学信息技术、医学信息系统。

3、医学信息技术:是用于管理和处理医学信息所采用的各种技术的总称,是人们用来获取信息、传输信息、存储信息、分析和处理信息、显示信息的相关技术,其研究内容涉及科学、技术、工程、以及管理等学科。包括的技术:感测与识别技术、信息传递技术、信息处理与再生技术、信息施用技术。

4、医学信息系统:是结合生物医学和卫生健康的科学理论与方法,应用信息技术解决医疗卫生和健康问题,为临床和管理决策提供支持的系统。常见的医学信息系统有:医院信息系统(HIS)、实验室信息系统(LIS)、临床信息系统(CIS)、图像存储与传输系统(PACS)、公共卫生信息系统(PHIS)、远程医学、信息检索、决策支持系统(DSS)、电子病历(EMR)、电子健康档案(EHR)。

5、医学信息学的主要研究进展有:电子病历被持续关注、电子健康正迅速崛起、数字技术更深入临床、信息系统建设方兴未艾、新兴分支学科快速成长。

第二章

1、知识管理(KM):是以整合及协作方式来促进信息资产的创造、捕获、组织、访问、和使用过程的一门学科。应用:知识管理在医疗卫生决策中的应用 知识获取、知识评估、证据形成 知识管理在临床实践中的应用 隐性知识的管理、显性知识的管理、隐性知识交流共享与显性化的管理

2、知识发现:是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的知识的过程。过程:选择、预处理、转换、数据挖掘、解释与评估

第三章

1、医院信息系统:是指利用计算机软硬件技术、网络通讯技术等现代化手段,对医院及其所属各部门的人流、物流、财流进行综合管理,对在医疗活动各阶段中产生的数据进行采集、存储、处理、提取、传输、汇总、加工生成各种信息,从而为医院的整体运行提供全面的、自动化的管理及各种服务的信息系统。

2、建设医院管理信息系统的意义:优化工作流程、提高运营质量、缩短诊疗周期、强化科学管理、节约诊治成本、改变决策方式

3、医院管理信息系统的功能:支持联机事务处理、支持科室级信息的汇总与分析、支持医院决策层对管理信息的需求

4、医院管理信息系统的内容:门急诊管理分系统、住院及病房管理分系统、病案管理分系统、检验信息管理分系统、检查信息管理分系统、药品管理分系统、手术与麻醉管理分系统、血库管理分系统、收费分系统、物资管理分系统、设备管理分系统、经济管理分系统、综合查询统计分系统、患者咨询服务分系统、医疗保险接口、系统工具

5、医院管理信息系统的运行维护的内容:中心机房的维护、软件维护、数据维护、数据字典维护、硬件维护、网络安全管理

第四章

1、医院信息系统(hospital information system,HIS)管理信息系统(hospital management information system,HMIS)临川信息系统(clinical information system,CIS)电子病历(electronic medical records,EMR)护理系统(nursing information system,NIS)

2、电子病历:是以患者为中心建立的一个完整的、终身的、纵向的、多媒体的、包含所有重要临床信息的记录。

3、临床信息系统:是利用信息技术、计算机技术和网络通信技术对患者信息进行采集、存

储、处理、传输,为临床医护人员所利用,以提高医疗质量为目的的信息系统。

4、社区:是由一定数量的人群组成,具有共同的地理环境,共同的文化背景与生活方式,共同的利益与需求的区域共同体。

5、社区卫生:为患者提供整合的、便利的医疗保健服务,医生的责任是满足绝大部分个人的医疗需求,与患者保持长久的关系,在家庭和社区的具体背景下工作。包括社区医疗和社区保健两个部分。

6、社区医疗信息系统的目标:以社区为中心以经济活动为轴线以行政管理为基础④通过对社区医疗卫生信息资源的统计处理和智能分析,实现对整个社区居民健康水平的科学评估,为政府和卫生行政部门提供决策支持依据,提高全体居民的健康水平

第五章

1、放射科信息系统(radiology information system,RIS)是基于医院影像科室工作流程和任务执行过程管理的计算机信息系统,主要实现医学影像检查工作流程的计算机网络化控制、管理和医学图文信息的共享,并在此基础上实现远程医疗。

2、RIS的功能:预约模块、检查模块、报告模块、查询模块、统计模块、管理模块

3、PACS(picture archiving and communication systems)图像存储与传输系统 是一个涉及放射医学、影像医学、数字图像技术(采集和处理)、计算机与通讯、C/S体系结构的多媒体DBMS系统,涉及软件工程、图形图像的综合及后处理等多种技术,是一个技术含量高、实践性强的高技术复杂系统。由图像信息的获取、传输与存档和处理等部分组成。

4、DICOM文件为医学影像的专用存储格式,其后缀为.dcm,在CT、磁共振、医院PACS系统中应用广泛。

5、数字医学图像通信协议(digital imaging and communication in medicine,DICOM)是关于医学数字图像和通信的国际标准,它为医学图像及其他数字信息在各种医疗设备之间的传输定义了统一的规范。

第六章

1、公共卫生信息系统(PHIS)是综合运用计算机技术、网络技术和通讯技术构建的覆盖各级卫生行政部门、疾病预防控制中心、卫生监督中心、各级各类医疗卫生机构的高效、快速、通畅的网络信息系统。

2、五级网络:乡镇、县(区)、地(市)、省、国家三级平台:地(市)、省、国家

3、公共卫生信息系统的建设原则:统一规划、分步实施;突出重点、纵横联网;规范标准、资源共享;平战结合、预警预报;多方投资、分级负责;明确职能、分层装备。是一个“横向到边,纵向到底”的系统建设项目。

4、电子健康档案:是人们在健康相关活动中直接形成的具有保存备查价值的电子化历史记录。

5、电子健康档案作用:满足自我保健的需要、满足健康管理的需要、满足健康决策的需要

6、电子健康档案特点:以人为本、内容完整、重点突出、动态高效、标准统一、分类指导

7、电子健康档案的系统构架:是以人的健康为中心,以生命阶段、健康和疾病问题、卫生服务活动作为三个维度构建的一个逻辑构架,用于全面、有效、多视角地描述EHR的组成结构以及复杂信息间的内在联系。

8、电子健康档案数据标准:全国统一、科学合理、满足基层、灵活适用。主要包括电子健康档案相关卫生服务基本数据集标准、电子健康档案公用数据元标准、电子健康档案数据元分类代码标准

9、以病历为基础的检测信息分类:以医院为基础的检测、有专门机构对专病进行管理

10、事件为基础的监测信息是以一宗特定的公共卫生事件作为检测信息管理对象。

11、疾病监测信息管理主要包括:信息采集、统计分析、信息反馈、预测预警、信息发布、监测组织和监测系统

12、卫生监督信息系统的目标:在建设覆盖全国卫生监督信息网络平台的基础上,建立健全卫生监督信息标准体系,完善的监督信息系统业务应用软件,共享卫生监督数据和信息资源,实现卫生监督工作实时、动态和科学管理,规范卫生监督执法行为,提高卫生监督工作效率。

13、卫生监督信息标准化指导思想:卫生信息化建设的一个重要基础,是建立卫生信息化标准,逐渐形成卫生标准化研究开发和组织管理体系。基本原则:科学严谨、分工协作、分步实施、不断完善

14、妇幼保健信息系统(MCIS):是指按照国家有关法律法规和政策、标准的要求,以计算机技术、网络通讯技术等现代化手段,对妇幼保健机构及相关医疗保健机构开展的妇幼保健服务工作各主要阶段所产生的业务、管理等数据进行采集、处理、存储、分析、传输及交换,从而为卫生行政部门、妇幼保健机构及社会公众提供全面等得自动化的管理及各种服务的信息系统。

第七章

1、远程医学:从广义上讲是使用计算机技术和远程通信技术提供的医学信息和医学服务,包括远程诊断、远程会诊、远程护理、远程教育、远程医学信息服务等所有医学活动。从狭义上讲,是指远程医疗,包括远程影像学、远程诊断及会诊、远程护理等医疗活动。

2、远程医疗:是综合应用信息技术在异地之间进行临床医学信息传输和处理的医疗活动,诸如临床咨询、远程会诊、远程检查、远程手术等。

3、远程卫生:是指利用各种远程通讯技术提供卫生服务和信息,是远程医疗概念的延伸或扩展。

4、电子健康:是以因特网为核心技术手段,通过网络普及实现医疗服务领域的通讯化革新,通过提高卫生体系的效率来减少卫生支出,通过提供更好的信息服务做出健康方案和进行自我护理,通过促进卫生专业实践和交流加强临床护理和卫生服务,通过应用新措施改善服务不到位人群的卫生质量。

5、数字医学是指以医院和患者为对象的数字化医学科学体系,是实现电子健康的技术支撑。

6、现代远程医学涵盖的医学活动的内容:医疗方面、教育方面、数据共享方面

7、远程医学系统的组成:医疗服务的提供者、寻求医疗服务的需求方、联系两者的通信网络、视频会议系统及诊疗装置

8、远程医学的支撑环境:软硬件系统支持环境、医学信息数字化环境、通信网络环境、协同工作环境、远程医学标准

9、远程医学的应用:远程医疗、远程医学教育、远程学术交流、远程信息资源共享

10、远程医学教育可提供的内容和形式:远程医学学历教育、远程继续医学教育、远程健康教育

第九章

1、决策支持系统(DSS):是一种辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。

2、医学决策支持系统是指将医学知识应用到某一患者的特定问题,提出具有最佳费用/效果比的解决方案的计算机系统。

3、通过CDSS对临床问题做出科学决策时需考虑3要素:患者需求、患者临床表现以及患者高危因素;医生的诊疗需求;基于循证医学的客观证据

4、现有的临床决策系统(CDSS)的主要形式:基于知识库的CDSS、基于非知识库的CDSS5、临床决策系统的构建方法:贝叶斯网络、人工神经网络、遗传算法、产生式规则系统、逻辑条件、因果概率网络

6、临床决策支持系统面临的技术上的挑战:系统维护、系统评价

第十章

1、生物信息学:是指应用信息科学的方法和技术,研究生物体系和生物过程中信息的存储、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,亦即生命科学中的信息科学。

2、生物信息学的发展阶段:前基因组时代、基因组时代、后基因组时代

3、生物信息学的研究内容:生物分子数据的收集管理、基因组注释、基因表达数据的分析、分子系统发生分析、完整基因组的比较、蛋白质结构预测、从功能基因组学到系统生物学

4、生物医学在医学领域的具体应用:疾病相关基因的识别、单核苷酸多态性、从模式生物研究疾病相关基因、生物信息学与药物设计

5、与基因有关的疾病分类:单基因病、多基因病、获得性基因病

6、识别人类疾病相关基因的传统研究方法:候选基因法、位置克隆法

7、识别人类疾病相关基因的现代方法:完整基因组比较、基因表达谱微阵列

篇3:生物信息学本科教学初探

1 本科生初学生物信息学存在的主要问题

经过三年教学实践发现, 西北农林科技大学生命学院生物技术专业、创新实验学院生物技术基地班和创新班的学生在学习《生物信息学》课程时主要存在以下两个问题:

一是学生因对该新兴学科不了解而造成对课程不重视。

在与学生的互动交流中, 我们了解到由于生物信息学是一门新兴的学科, 绝大多数学生对该课程的认知度几乎为零, 对该领域非常陌生, 不清楚学后有何用处, 甚至认为该门课程没有什么用处, 导致学习目的不明确, 学习动力不足。然而一些学生参与科学研究后, 认识到生物信息学的重要性而重回课堂或重新学习本课程。

二是课程理论性强, 学习资源多以英文编写, 因而基础差的学生倍感吃力。

由于本课程理论知识非常抽象, 前后知识点的衔接相对比较紧凑, 且生物信息学相关网站、数据库和软件等学习资源均以英文为主, 部分学生的数学、计算机和英语等基础知识不够扎实, 在不能有效掌握某些知识点后, 逐渐产生厌学情绪, 甚至放弃学习。

2 教学模式探索

2.1 提高学生对生物信息学的认知度。

绝大部分学生在刚接触生物信息学时对该课程的认识非常有限, 对于该课程所涉及的主要内容及应用更是所知无几, 若直接对学生讲授大量枯燥乏味的算法、晦涩难懂的模型以及全英文的操作界面等将会促使学生失去学习的兴趣。因此, 提高学生对生物信息学知识及其应用的认知、将学生的思维引入所学内容是非常关键的一步[2], 可以提高教学中的“学”的主动性及积极性。

实际应用范例是最为形象和最易理解的教学素材, 能够帮助学生简单直观地了解所学知识的实际应用。可以以教师自身科研工作及本学科领域最新研究成果或经典案例作为教学素材, 从背景知识、研究目的和意义、研究方法及研究结果等几个方面做深入浅出的讲解, 从而使学生从整体上清晰地了解所学的知识点及其在今后学习、工作或研究中的应用, 进而激发学生的学习兴趣。

2.2 双语教学的必要性。

早在2001年教育部就颁布了《关于加强高等学校本科教学工作提高教学质量的若干意见》 ([2001]4号) , 意见第八条为“积极推动使用英语等外语进行教学”。明确指出“为适应经济全球化和科技革命的挑战, 本科教育要创造条件使用英语等外语进行公共课和专业课教学。对高新技术领域的生物技术、信息技术等专业, 更要先行一步”。2005年颁布的《关于进一步加强高等学校本科教学工作的若干意见》 ([2005]1号) 再次强调“要提高双语教学课程的质量, 继续扩大双语教学课程的数量”。

作为生物技术领域的前沿学科, 生物信息学开展双语教学顺应了中国高等教育发展的趋势, 是时代的需要, 是我国高等教育适应国际化趋势发展的需要[3]。生物信息学双语教学有利于学生更好地学习该门课程和掌握学科发展的前沿知识。英语是当前国际交流的通用语言, 绝大部分高水平的科研论文、著作都是采用英文撰写, 特别是生物信息学领域重要的网络在线数据库和软件等资源均是英文界面。生物信息学双语教学可以帮助学生掌握更多的英文专业术语, 从而有利于查阅和使用英文网络在线资源、阅读英文原版书籍和文献、获取更多本学科领域的前沿知识。

2.3 实践与理论穿插进行。

目前我们的课程设置为先学习理论课, 之后进行生物信息学实践。三年来, 学生普遍反映应将二者穿插进行, 更有利于快速掌握所学知识。生物信息学是理论知识与实践应用并重的学科, 课程知识点间连贯性强, 因而在讲授每个知识点后, 应在同一周内安排学生在计算机房进行实践, 并布置相应的习题帮助学生巩固和加深对知识点的理解与掌握, 为学习下一知识点做好准备。

2.4 互动答疑与资源共享。

教师利用课间及课余时间答疑会受到很多因素的制约, 而使其效果不明显。充分利用课程网络教学平台进行师生互动式答疑, 可以提高教师的答疑效率, 更重要的是可以使同学们共享所提出的不同问题;而且还有利于教师掌握学生对本课程的学习情况, 并据此调整授课方案, 达到更好的教学效果;此外可以就课程中的疑难问题组织学生在平台讨论区进行自由讨论, 使学生通过讨论加深对知识点的理解。

3 教材选择

鉴于生物信息学进行双语教学的重要性, 在教材选择上就应当以英文原版教材为主, 同时提供一些经典的中文教材作为参考。对于本科生教育, 理想的英文原版教材应当涵盖较广的知识范围、具有系统性的讲解且能够深入浅出, 同时, 语言表达要通俗易懂。目前国内引进的生物信息学相关英文原版教材中有些属于科普性质, 其内容过于简单, 而有些偏向研究性质, 对问题的分析过于复杂, 适合本科生学习的英文原版教材仍显欠缺。

4 师资力量

生物信息学不同于传统学科, 它所涵盖的内容更新速度之快, 要求授课教师必须紧跟学科领域前沿发展动态, 不断更新授课内容, 使教学与国际接轨;其次, 双语教学要求授课教师具备较高的专业英文水准, 能够把握好授课过程中的中英比例及难易程度。目前国内生物信息学双语教学的优秀教师还是非常缺少的, 应加强对双语教学师资的培训。

5 结论

本科生开设生物信息学是为了顺应国际科技发展的趋势, 使学生掌握最新的生物研究技术, 提高学生的创新及综合能力。虽然目前还未具有传统学科那样丰富与成熟的教学经验, 但只要针对存在的问题逐步地进行教学改革尝试, 便能够不断提高教学效果、积累教学经验, 促进创新型人才的培养。

参考文献

[1]Jonathan Pevsner, Bioinformatics and Functional Genomics, Wiley, 2005:1-12.

[2]邱志军.一般本科院校生物信息学课程教学的思考[J].科技信息, 2012, 33:646.

篇4:生物信息学现状分析

【关键词】生物; 信息学; 技术

中图分类号:G633.91 文献标识码:A 文章编号:1009-8283(2009)05-0258-01

1 生物信息学的产生

21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。

2 生物信息学研究内容

2.1序列比对

比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基礎上编写的比对软件包——BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。

2.2 结构比对

比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。

2.3 蛋白质结构预测

从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。

2.4 计算机辅助基因识别

给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。

2.5 非编码区分析和DNA语言研究

在人类基因组中,编码部分进展总序列的3~5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。

3 生物信息学的新技术

3.1Lipshutz(Affymetrix,Santa clara,CA,USA)

Lipshutz(Affymetrix,Santa clara,CA,USA)描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。

3.2 基因的功能分析

Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务——基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。

Babbitt(University of California,San Francisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列 是重要的。

3.3 新的数据工具

Letovsky(Johns hopkins University,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(common coordinate system)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。

Candlin(PE applied Biosystems,Foster City,CA,USA)介绍了一种新的存储直接来自ABⅠPrism dNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。

参考文献:

[1]顾明亮. 生物芯片技术及展望[J] 滨州医学院学报, 2003,(02) .

[2]菅复春,张子宏,肖乃淼,张龙现. 基因芯片技术的应用[J] 河南畜牧兽医, 2006,(08) .

篇5:生物信息学小结

目前一般意义的生物信息学是基因层次的

它是一个包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面学科领域。

生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测。

他是近年来发展并完善起来的交叉学科。这门学科是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。

生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。基因组信息

蛋白质的结构模拟 药物设计

它们是生物信息学的三个重要组成部分,生物信息学目前已在理论生物学领域占有了核心地位,它广泛地应用在生物、医药、农业、环境等学科。

2.广义生物信息学主要包括哪几个方面? 广义生物信息学主要包括如下几个方面:

一、生物的遗传信息

DNA―RNA―蛋白质,遗传信息—转录—翻译,遗传信息生物信息学。

二、生命活动的调控

基因的功能、表达和调控(表观遗传学)。蛋白的结构、功能和调控;细胞活动(分化、发育、衰老、死亡)的调控,器官、系统、整体活动的调控;节律、生物钟、分蘖、生长、开花、结果、营养的吸收、传输、转化、对外界信号的反应:含羞草、抗逆性。

三、生物电磁学与电磁生物学

生物电磁学:生命活体在不同层次(电子、离子、原子、基因、细胞、组织、整体等)的活动和不同属性(包括思维、精神)活动时以及和外界环境(生命体周围直至宇宙)相互作用时反映出来的各种电磁信息。人体的电磁辐射(包括发光):频率、强度、频谱。人体信号的调制方式:调幅、调频、编码。

电磁生物学:电磁辐射对生物体的影响,电磁场导致DNA突变,体内细胞电离、极化状态变化导致疾病。

四、视觉系统与光信息处理

视网膜神经元回路与信息处理、彩色视觉及彩色图像的编码、变换机制、眼动成象机制及宽视场、消色差动态成象系统、视觉认知机制及其图像信息的智能模式识别、不同状态立体视觉机制和静态、动态立体视锐度。

五、脑和神经系统与信息

脑的感知觉信息处理原理及其应用,学习、记忆、思维,逻辑思维和形象思维,思维模型与信息处理系统新原理的研究,新的计算模型、新型计算机、如:神经计算机。

六、生物体结构与微光机电系统

DNA驱动的微细机器人,生物大分子到细胞基本结构体系的自组装、自组织,创造新物质的分子工程学研究,分子聚集体的化学。

纳米生物技术将纳米技术和生物技术相集成,在生物医学、电子学、材料学、环境科学等诸多领域具有良好的应用前景。在生物芯片、分子马达、生物探针、纳米生物材料等迅速发展。

七、基因芯片、蛋白质芯片等

目前一般意义的生物信息学是基因层次的,是近年来发展并完善起来的交叉学科。这门学科是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。

3.Internet有哪些基本功能?

Internet不仅向其用户提供了全球范围的信息交流与快速通讯手段,其本身也具有极其丰富的信息资源,包括新闻、书刊杂志、数据库、计算机软件、多媒体资料等,也包括大量的生物信息学资源。

4.什么是Entrez?Entrez主要包括哪几个数据库?

Entrez(http://www.ncbi.nim.nih.gov/entraz)是美国国立医学图书馆国家生物技术信息中心(National Center for Biotechnology Information, NCBI)建立的生物医学数据库集成检索系统。系统中的数据库包括核酸序列数据库、蛋白质序列数据库、大分子三维结构数据库、全部基因组、孟德尔人类遗传及通过PubMed检索的MEDLINE。Entrez集成系统的最大特点是通过任何一个数据库检索出的信息可直接链接到Entrez其它数据库并找到相关的检索结果。

5.PubMed的一般检索方法有几种检索途径?

通过NCBI首页(http://www.ncbi.nlm.nih.gov/)或NCBI的Entrez检索系统(http://www.ncbi.nlm.nih.gov/Entrez/)选择PubMed链接选项或直接在浏览器地址栏(URL)中输入“http://www.ncbi.nlm.nih.gov/entrez/query.fcgidb=PubMed”即可进入

PubMed检索界面。PubMed有多种检索途径,包括自由词、文献作者、规范主题词(MeSH)、期刊名称、文献出版年代、文献类型、文献语种、物质名称、记录入档日期、文献出版日期等。既可以单一字段检索,又可以利用高级布尔逻辑表达式多字段组配检索。

6.国际上三大DNA数据库是什么数据库? ,国际三大DNA数据库:NCBI的GenBank,欧洲分子生物学实验室(European Molecular Biology Laboratory, EMBL)、日本DNA数据库(DNA Data Bank of Japan,DDBJ)

7.简述进行基因搜索时的基本步骤 ?

在进行基因搜索时的基本步骤:

1、寻找DNA序列中基因不可能出现的区域,并将此遮蔽起来。

2、在启动子区寻找一致的模式,找出转录因子识别DNA结合区域。

3、寻找转录的起始密码、终止密码和剪切位点。

4、找出编码区。然后将全部收集到的信息汇总整理成总体上尽可能连贯的谱图。注意进行不同的分析时使用不同的软件工具以及程序适用的物种选择和应用范围等。

8.BLAST的主要功能都包括什么 ?

1、核酸数据库搜索

组合基因组检索;分为标准的核酸与核酸数据库搜索;MEGABLAST提供大量长序列的比较;完全匹配的短序列搜索;特殊搜索。

2、蛋白数据库搜索

分为标准的蛋白与蛋白数据库搜索;PSI-and PHI-BLAST,其中PSI用于搜索证实远源进化关系的存在与否和进一步获取这个蛋白家族中的功能信息,而PHI用于搜索蛋白基序;同样包括蛋白的完全匹配的短序列搜索。

3、已翻译蛋白的BLAST搜索

包括[blastx],[tblastn],[tblastx]

4、保守区域的搜索:主要使用RPS-BLAST程序完成。

5、配对序列的两两比较:用于核酸和蛋白的两两比较分析。

6、针对特定数据库的搜索:比如人类基因组、微生物基因组等。

9.利用核酸序列进行基因结构预测的基本步骤是什么?(不确定)一个全面的基因搜索方案,无论是通过单个集成的程序实现,还是通过多个程序分步实现,基本的思路是相同的:

1、通常如果一个序列中某一区域出现重复序列,该区域不大可能处于调控区域和编码区域。

2、如果某一片段与其它基因或基因产物有序列相似性,该片段是外显子的可能性极大。

3、一段序列上存在着统计的规则性,表现为显著的“密码子偏好”,是蛋白编码区最明显的标志之一。

4、与模板模式相符可能指出DNA上功能性位点的位置。这类分析可以基于很简单的模式(例如,众所周知的“TATA box”和剪接点的保守序列)或基于相当复杂的推理(例如,在后面将提到的启动子搜寻算法中)。

10.根据蛋白质的氨基酸序列预测其空间结构主要预测方法有哪两类?

预测方法主要有两类:

一、采用分子力学、分子动力学的方法,根据物理化学的基本原理,从理论上预测蛋白质分子的空间结构。

二、通过对已知空间结构的蛋白质进行分析,找出一级结构与空间结构的关系,总结出规律,用于新的蛋白质空间结构的预测。本章介绍利用分析蛋白质氨基酸的组成来确认未知蛋白的计算工具、蛋白翻译后修饰、蛋白功能预测。

组成蛋白质的氨基酸序列为蛋白质的一级结构,蛋白质的一级结构决定了蛋白质的性质。组成蛋白质的氨基酸的物理和化学性质早已被人熟知。构成蛋白质的20种氨基酸由于化学构造不同,在结构和功能上具有多样性,任一残基对蛋白质的物理和生化性质都会产生影响,即序列决定构象。由于蛋白质空间结构的基础是一级结构,近年来根据蛋白质的氨基酸序列预测其空间结构,受到科学家的关注。

11.谈谈学习生物信息学的体会(自己发挥吧)

有点粗糙,见谅

篇6:生物信息学论文

韩雪晴

(生物工程1201班,学号:201224340124)

摘要:生物信息学是一门研究生物和生物相关系统中信息内容和信息流向的综合性系统科学。80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。

关键词:生物信息学;进展;序列比对;生物芯片

A review of the advances in Bioinformatics

Han Xueqing(Bioengineering, Class1201,Student ID:201224340124)

Abstract: Bioinformatics is the science of comprehensive system of information content and information flows to a study on the biological and bio related in the system.The edge of an emerging discipline since 80, has broad prospects in which information.With the human genome project was completed and the development of bioinformatics are inextricably linked, for the life science research development of bioinformatics for the development of life science has also brought a lot of convenience, has made the simple analysis.Keywords:

bioinformatics;progress;Sequence alignment;biochip

1、生物信息学的产生背景

生物信息学是20世纪80年代末开始,随着基因组测序数据迅猛增加而逐渐兴起的一门学科[1]。应用系统生物学的方法认识生物体代谢、发育、分化、进化以及疾患发生规律的不可或缺的工具[2]。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。

2、生物信息学研究内容

主要是利用计算机存储核酸和蛋白质序列,通过研究科学的算法,编制相应的软件对序列进行分析、比较与预测,从中发现规律。白细胞介素-6(IL-6)是机体重要的免疫因子,但在两栖类中未见报道。采用生物信息学方法对两栖类模式动物非洲爪蟾IL-6进行分析[3]。以人IL-6基因对非洲爪蟾数据库进行搜索、分析,并采用RT-PCR方法对所得序列进行验证。结果表明,非洲爪蟾IL-6基因位于scaffold_52基因架上,具有保守的IL-6家族基序[4]。采用生物信息新方法进行不同物种的免疫基因挖掘、克隆,是一种有效的方法[5]。

2.1序列比对

比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BLAST和FASTA[6]。序列数据库搜索最著名且最常用的工具之一便是BLAST算法。FASTA算法是另一族常用的序列比对及搜索工具[7]。

2.2结构比对

比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。

2.3蛋白质结构预测

从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构[8]。

3、生物信息学的新技术 3.1 Lipshutz(Affymetrix,Santa clara,CA,USA)

描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序[9]。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测[10]。

3.2基因的功能分析

Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。

4生物信息学前沿

4.1生物芯片技术

4.1.1生物芯片的简介

生物芯片技术是通过缩微技术,根据分子间特异性地相互作用的原理,按照芯片上固化的生物材料的不同,可以将生物芯片划分为基因芯片、蛋白质芯片、细胞芯片和组织芯片。4.1.2生物芯片的基本内容

生物芯片技术通过微加工工艺在厘米见方的芯片上集成有成千上万个与生命相关的信息分子,它可以对生命科学与医学中的各种生物化学反应过程进行集成,从而实现对基因、配体、抗原等生物活性物质进行高效快捷的测试和分析。4.1.3生物芯片的发展

生物芯片将会给21世纪整个人类生活带来一场“革命”。生物芯片产业也有望与“微电子芯片”并列成为21世纪最大的产业之一。4.1.4与生物芯片相关的技术

平面微加工技术、微机械技术、CCD成像技术、基因芯片技术等。

4.2药物设计与生物信息学

药物基因组学可以说是基因功能学与分子药理学的有机结合,在很多方面这种结合是非常必要的。药物基因组学以药物效应及安全性为目标,研究各种基因突变与药效及安全性的关系。

4.3基因治疗

基因治疗(gene therapy)是指将外源正常基因导入靶细胞,以纠正或补偿因基因缺陷和异常引起的疾病,达到治疗目的[11]。也就是将外源基因通过基因转移技术将其插入病人的适当的受体细胞中,使外源基因制造的产物能治疗某种疾病[12]。通过对miR-29a进行靶基因预测及相关生物信息学分析,为miR-29a靶基因的实验验证提供数据支持,以期为深入研究miR-29a的生物学功能和调控机制提供理论指导[13]。从广义说,基因治疗还可包括从DNA水平采取的治疗某些疾病的措施和新技术。在基因治疗中迄今所应用的目的基因转移方法可分为两大类:病毒方法和非病毒方法[14]。

4.4虚拟细胞--人工生命的模型

虚拟细胞是应用信息科学的原理和技术,通过数学的计算和分析,对细胞的结构和功能进行分析、整合和应用,以模拟和再现细胞和生命的现象的一门新兴学科。虚拟细胞亦称人工细胞或人工生命[15]。目前,国际上已有两个虚拟细胞问世,一个是日本的原核虚拟细胞模型,一个是美国的真核虚拟细胞模型。

参考文献

[1].张阳德,生物信息学(第二版)科学出版社,2010,21世纪高等院校教材ISBN978-7-03-023931-0 [2].迈克尔 R.巴恩斯(Barnes.M.R.),遗传学工作者的生物信息学,科学出版社2010年10月1日出版ISBN 9787030254900 [3].齐志涛;张启焕;王资生;许伟;黄贝;王爱民,非洲爪蟾IL-6基因的克隆及生物信息学分析 出版日期: 2010 [4].齐志涛;张启焕;黄贝;王资生;仇明;黄金田;许伟;王爱民.非洲爪蟾BAFF及其信号通路相关基因的比较生物信息学分析,生物技术,2011,(4):

[5].廖明帜,生物背景学生的《生物信息学》课程教学思考与探索,教育教学论坛,2014年第36期

[6].Dan E.Krane&Michael L.Raymer,生物信息学概论,清华大学出版社 2010年出版

[7].Eddy S R.Profile Hidden Markov Models.Bioinformatics,1998,14(9):755~763 [8].Coombes KR,Fristche HA,Clarke,et al.Qutility control and peak finding for proteomics data collected from nipple aspirate fluid by surface-en-hanced laser desorption and ionization.Clin Chem,2013,49(10):1615~1623 [9].Lim HA,Batt tR.TIBTECH,1998;16(3)):104.[10].Williams n.Science,1997;277(5328):902.[11].顾健人,曹雪涛,基因治疗,北京:科学出版社,2011 [12].余国膺,生物信息学,中国心脏起博与心电生理杂志,2014年01期 [13].施伟杰

曾玉

姚纯

曹笑梅

童华,miR-29a靶基因预测及其相关生物信息学分析,现代生物医学进展,2014年32期

[14].安冬

姜涛

张翠丽

殷玉玲

曹雪姣

辛毅,臧师竹利用生物信息学研究肥胖与2型糖尿病患者肝组织基因表达变化,《现代生物医学进展》 2014年30期

上一篇:洮坪乡纪委工作报告下一篇:送河间晁寺丞,送河间晁寺丞王安石,送河间晁寺丞的意思,送河间晁寺丞赏析