生物信息学名词解释(共12篇)
1.生物信息学名词解释 篇一
浅谈对生物信息学的认识
摘要生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学, 是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。经过一学期的学习,我学到了很多很有用的知识,给我印象最深的有序列比对、蛋白质结构分析、核酸序列分析、数据库及数据库检索等内容。关键字:生物信息学认识基因组学数据库
时光飞逝,一学期马上就要结束了,本学期的专业选修课也即将结束。在上课之前,我一直认为生物信息学就是在讲关于人类及动物的基因,以及基因之间的差别。但是,刚上了几节课,我就发现生物信息学根本不是我想象的那么简单,就这样我怀着对自己的怀疑和对这门课的好奇走进了这门课。
生物信息学是一门新兴的、正在迅速发展的交叉学科,美国国家基因组研究中心认为, 生物信息学是一个代表生物学、数学和计算机的综合力量的新兴学(Bioinformatics is an emerging scientific discipline representing the combined power of biology,mathematics, and computers)。
现代生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学, 是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。
在这短短的一学期课中,在老师的带领下,我们学到了很多关
于生物信息学的知识,其中给我印象最深的有序列比对、蛋白质结
构分析、核酸序列分析、数据库及数据库检索等内容。
比如,序列比对,它的基本问题是比较两个或两个以上符号序列的相似性或不相似性。从生物学角度来看,它包含很多意义;如从
相互重叠的序列片段中重构DNA的完整序列等。老师主要给我们介
绍了blast比对。
再如,对蛋白质的分析。比如我们实验测定了一条蛋白质序列
或者从DNA序列翻译得来一条蛋白质序列,我们要借助生物信息学
方法来对它进行基本性质及结构分析。其中基本性质包括它的分子
量、氨基酸数目、排列顺序、等电点分析等。结构分析包括跨膜螺
旋分析等。要运用的工具是protparam tool 和TMHMM。对于这两
个工具我都进行了实际操作练习,我觉得这对我们以后的理论学习
和实验分析都非常重要。现代生物信息学的主要研究领域及其进展
1、基因组学和蛋白组学研究
基因组和蛋白组研究是生物信息学的主要内容.同样, 生物信息
学是基因组和蛋白组研究中必不可少的工具。
基因组学(Genomics)和蛋白组学(Proteomics)的实质就是分析和解读核酸和蛋白质序列中所表达的结构与功能的生物信息.这方面的研究已成为生物信息学的主要研究内容之一.一种生物的全部遗传构成被称为该种生物的基因组.有关基因组的研究称为基因组学.其中, 序列基因组学(Sequence genomics)主要研究测序和核苷酸序列;结构基因组学(Structural genomics)着重于遗传图谱、物理图谱和测序等方面的研究;功能基因组学
(Functional genomics)则研究以转录图为基础的基因组表达图谱;比较基因组学(Comparative ge2nomics)的研究内容包括对不同进化阶段基因组的比较和不同种群和群体基因组的比较。
蛋白组和蛋白组学的概念是随基因组和基因组学的出现而出现的.蛋白组(proteme)的概念是由于基因表达水平并不能代表细胞中活性蛋白质的数量, 基因组序列并不能描述活性蛋白质所必需的翻译后修饰和反映蛋白质种类和含量的动态变化过程而提出的.在一定条件下某一基因组蛋白质表达的数量类型称为蛋白组, 代表这一有机体全部蛋白质组成及其作用方式.有关蛋白组的研究称为蛋白组学.其中, 蛋白组的研究技术与方法、双向凝胶电泳图谱以及对不同条件下蛋白组变化的比较分析是蛋白组学的主要研究内容。生物信息学在基因组和蛋白组研究中所起的作用主要有:(1)基因组信息结构的计算分析.即对基因组数据进行大规模并行计算并预测各种新基因和功能位点, 研究大量非编码区序列的信息结构和可能的生物学意义。(2)模式生物全基因组信息结构的比较研究.即
对已完成全基因组测序的各种模式生物的基因组信息结构进行比较分析, 包括同源序列的搜索比较和指导基因克隆.(3)功能基因组的相关信息分析, 包括对基因表达图谱及其相关算法和软件的研究, 与功能基因组信息相关的核酸、蛋白质的空间结构的预测模拟以及蛋白质的功能预测。
2、生物信息数据库
复杂的生物和生物界和日新月异的生命科学研究产出的大量的生物学信息,对这些信息的储存、检索、比较分析必须借助于计算机数据库技术, 包括各类生物学信息数据库的建立与维护、数据的添加与注释、更新与查询、数据库资料的网络化等研究内容。现有的数据库有:核酸序列数据库(GenBank、EMBL、DDBJ)、基因组数据库、基因图谱数据库、蛋白质序列数据库(SWTSS-
PROT、PIR)和蛋白质结构数据库(Interpro)等。随着生命科学的不断发展,数据库种类不断增加、结构日益复杂、使用也越来越方便。
生物信息学作为一门新兴学科已经成为生命科学研究中必不可少的研究手段 本文对数据库与数据库搜索序列比对蛋白质结构预测药物设计基因芯片技术几个方面做了介绍较为系统地阐述了生物信息学在这些领域的应用 当然它所涉及的内容与方法远远不只上面提到的那些 新基因和 的发现与鉴定非编码区信息结构分析遗传密码的起源和生物进化完整基因组的比较
研究 大规模基因功能表达谱的分析等都是生物信息学研究的对象 相信不久的将来生物信息学会在生命
科学领域扮演越来越重要的角色。
参考文献:
1、现代生物信息学及其主要研究领域 萧浪涛(湖南农业大学理学院, 湖南长沙 410128)
2、生物信息学技术进展 郭志云 张怀渝 梁龙 军事医学科学院 生物工程研究所,北京100071;四川农业大学生命科学及理学院,雅安 6250143、利用生物信息学技术研究蛋白功能的几种方法 王剑利 杨章民综述 王一理审阅 西安交通大学医学院免疫病理学研究室(西安, 710061)
2.生物信息学名词解释 篇二
关键词:生物信息学,研究生教学,实践
1. 引言
生物信息学 (bioinformatics) 是一门新兴的交叉学科, 生物学与医学、数学、计算机科学是其中三个主要组成部分。生物信息学作为跨越生命科学和信息科学两大热点领域的学科, 拥有蓬勃的生命力。面对人类基因组计划所产生的庞大的分子生物学信息, 生物信息学的重要性已越来越突出, 它无疑将会为生命科学的研究带来革命性的变革。[1,2]国内外对生物信息学的人才需求也在激增。
目前, 生物信息学在我国尚处于起步阶段, 因为要进行生物信息学的研究, 对人员要求很高, 需要深厚的生物大分子结构和功能方面的背景知识, 需要扎实的应用数学或统计学知识, 还需要精通计算机, 至少得具备三者之二。但实际情况是大部分从事生物学研究的人不熟悉计算机, 而从事计算机科学的人员多数又缺乏对生物学的了解。尽管如此, 生物信息学的教育在国内外高等院校及科研机构越来越普及。据不完全统计, 我国超过30个高校或科研机构开设生物信息学专业课程。[3]这些研究与教育一般分散在多个系所属的多个专业中, 如生命科学院 (北京大学等) 、计算机学院 (哈尔滨工业大学等) 、理学院 (天津大学等) , 我校是由计算机学院开设全校公共课。不同学校根据自身的情况, 在开设生物信息学这门课时, 侧重点都不一样。如果由医学院的教师授课, 则侧重点可能在致病基因的研究方面, [4]计算机专业教师授课则可能侧重于数据库的管理、查询等方面, [5]理学院的教师授课则可能侧重于生物信息学中的数学问题。笔者是计算机专业出身的, 研究方向为图像处理与模式识别, 所以主要从计算机和数学的角度去授课。另外, 研究生教学又与本科生教学[6]不同, 研究生教学更加应该注重培养学生的主动学习意识和综合能力。笔者将教学实践中的心得进行了初步的总结, 以供商榷。
2. 注重培养学生的学习兴趣
从培养学生的学习兴趣出发, 在课堂教学过程中, 充分利用丰富的网络资源, 如图像、视频等。比如在介绍模式生物时, 可以给出各种模式生物的图像;在介绍各种各样的生物数据库时, 可以在课堂上现场上网登陆数据库, 演示和介绍各个数据库的特点和使用方法等。研究生不同于本科生, 本科生可能比较习惯于教师的灌输性教学, 而研究生教学更加鼓励学生主动自觉地学习。这从“研究”一词的英文解释“re-search”———再 (“re-”) 探索 (“search”) 中也可以看出。教师在研究生学习过程中主要起引路的作用, 而不可能手把手带着学生研究。生物信息学更是如此, 它是一门新兴的交叉学科, 很多理论和研究内容还不成熟, 需要科学工作者不断地探索。因此, 通过生动形象的启发式课堂教学, 培养学生的学习兴趣, 对学生以后的进一步研究有着重要的作用和意义。
3. 注重培养学生的综合素质
在生物信息学的上课过程中安排几次学生的课堂报告。具体做法是:由教师或学生在国外重要期刊 (如Bioinformatics) 或会议上找与学生自身的研究方向比较相近的生物信息学方面的最新文献, 然后几个学生一组共同针对某几篇文献进行阅读、理解, 最后以报告的形式跟大家一起交流和讨论。在这个过程中, 可以培养学生的如下几个方面的能力:
(1) 搜寻资料的能力。现在网络非常发达, 网络资源也非常丰富, 如何从纷繁复杂的网络资源中找到自己所需的资料不是一件容易的事。学生可以通过学校购买的数据库进行查找适合自己的文献资料, 也可以通过搜索引擎进行查找。通过这个过程, 学生可以了解有哪些数据库可以利用, 哪些网站资源比较丰富, 以及选择什么关键词进行查找比较有效, 等等。
(2) 阅读外文文献的能力。学生在本科阶段一般没有读外文文献的习惯, 而进入研究生学习阶段, 为了了解和研究国际前沿领域, 就必须阅读大量外文文献, 毕竟国外的科技实力在很多方面还是处于领先位置的。给学生指定几篇优秀的外文文献进行阅读和理解, 可以一定程度上锻炼学生阅读外文文献的能力。因为要想真正理解文献的内容, 就必须对文献进行仔细认真的阅读和研究。
(3) 团结协作的能力。每个课堂报告都是由几个学生共同参与完成的, 在这过程中有组织协调和分工的问题, 这需要大家共同努力, 团结协作。团结协作在当今社会越来越被推崇, 所以培养学生团结协作的能力对于他们以后进入社会很有帮助。从实际执行的情况看, 效果还不错。比如有的学生数学基础好, 他就负责理解文献中的公式和算法部分;有的学生计算机能力比较强, 他就负责编程实现、课件制作等。
(4) 口头表达的能力。课堂报告的最后陈述和讨论可以锻炼学生的口头表达能力。有的学生平时很少有作报告的机会, 所以口头表达的能力得不到锻炼。本课程提供给学生一次口头表达能力锻炼的机会, 让学生体会到如何组织报告内容、如何把自己理解的内容介绍给听众是比较有效的, 是容易被大家理解和接受的。
4. 理论与实践相结合, 鼓励交叉性研究
为了做到学有所用, 笔者从每个学生自身的研究方向出发, 为每个学生指定与其研究方向相关的生物信息学方面的最新文献进行阅读和理解。鼓励学生进行跨学科切交叉性研究, 将所学的生物信息学知识应用于实际的研究中, 或者利用已掌握的知识促进生物信息学的研究。比如课堂上的计算机学院的学生有研究图像处理与模式识别的, 就给他们安排一些生物图像处理、基因识别等方面的文献。这种交叉性的学习和研究, 有可能激发学生的灵感, 获得比较大的创新性成果。
5. 结语
生物信息学课程教学的实践表明, 学生经过这门课程的学习, 学到了一定的内容, 如对生物信息学这门课有了比较清楚的了解和认识、综合素质得到了一定的提高、找到了一些适合自己的研究切入点等。总的来说, 教学效果不错, 但还需要进一步探索, 进一步完善。
参考文献
[1]张阳德.生物信息学[M].北京:科学出版社, 2005:1-15.
[2]郝柏林, 张淑誉.生物信息学手册[M].上海:上海科学技术出版社, 2002:1-10.
[3]许忠能.生物信息学[M].北京:清华大学出版社, 2008:8-17.
[4]曹骥, 黎丹戎.浅谈医学生物信息学的教学模式[J].广西医科大学学报, 2007, (24) :122-123.
[5]孙米.计算机科学与生物信息学教育的关系[J].陕西教育学院学报, 2004, 20 (1) :78-80.
3.生物信息学名词解释 篇三
关键词:生物信息学 大数据 教学改革 学习兴趣
中图分类号: G642.0 文献标识码:A 文章编号:1674-098X(2016)05(c)-0000-00
生物信息学(Bioinformatics)是一门多元化新兴交叉学科,涵盖了基因组学、计算机科学、数学分析、模式识别、生物统计学等多学科知识[1]。研究内容涉及了基因组信息的获取、整理、存储、比对分析、功能分析、靶点筛选等生物医学领域各个方面。1956年,首届“生物学中的信息理论研讨会”在美国田纳西州盖特林堡召开,生物信息学这一概念被专家提出。随着计算机技术的发展以及人类基因组计划的实施,生物信息学理论被逐步完善。在当代生物医学研究领域,生物信息学这门独特学科的优势逐渐显现,在医学研究中起着不可替代的作用。
2015年,美国政府提出了“精准医疗”战略计划。精准医疗是将现代遗传技术、生物信息学技术、分子影像技术等与患者临床信息相结合,实现精准疾病分类与诊断,制定个性化的预防及治疗方案。我国也在“精准医疗”战略方案上不断跟进,并取得了一系列成果。近年来,随着基因组学研究的不断深入以及高通量测序技术的飞速发展,生物医学研究领域迎来了一个崭新的“大数据”时代。各大平台产生的多组学海量生物数据的存储、分析、发布等问题亟待生物信息学来解决。因此,有学者提出了“生物信息学云服务”概念,简称生物信息云[2]。生物信息云理论提出了海量生物数据的储存、获取、分析等相关需求的服务,是“精准医疗”计划开展和实施的重要手段。因此,扎实掌握生物信息学基础知识,熟练运用生物信息学软件、方法处理生物医学大数据对于生物信息学生来说至关重要。
1“大数据”背景下生物信息学教学中的问题
笔者在对医学院校本科生进行生物信息学教学实践中发现的问题进行了如下总结:
1.1教学进程安排不合理
生物信息学专业课程开设时间较晚。以本学校为例,生物信息相关的专业课程(例如:模式识别、生物数据可视化等)一般都开设在最后一个学年。这一时期正是学生们进行毕业设计的开题阶段,也是一些同学着手准备考取研究生的阶段。由于生物信息学专业知识的缺乏,许多学生并不知道自己需要哪种知识储备,甚至还不清楚自己课题的研究方向。面对就业和考研的双重压力,许多学生在本学期的课程上提不起兴趣,而把大量精力放在了如何做课题以及复习考研上。而在课程设置上,这一学期往往是生物信息学本科阶段中相对重要的时期,多门生物信息学专业课程在此学期展开。这就会导致在课堂上老师拼命讲,学生无心听的现象产生。而缺少对生物信息学专业知识的掌握,也会导致学生们在毕业设计过程中心有余而力不足,直接影响课题进展。
1.2教材建设不完善
教学中缺乏适合生物信息学专业的理论和实验教材。近年来,随着生物信息学的发展,相关的专业书籍也不断涌现,其中外文翻译教材占大多数。由于外文教材需要经历从国外引进、翻译、重新排版等过程,使得这类教材出版周期长,从而导致教材的出版速度赶不上日益更新的生物信息学新技术、新方法。再者,这些教材的编写与设计主要是针对国外生物信息学专业学生。由于教育方式、文化、以及背景知识等差异,国内学生学习目的性更强,对教材的需求及认知与国外相比有着显著不同,这也使得很多外文翻译教材对于国内学生并不适用。当前生物信息学领域教材覆盖范围广、涉及知识内容丰富。这是新兴学科的教材优势,但也暴露出了一些不足之处。许多教材一味追求知识面广,在一些生物信息学专业知识点上只是一笔带过,并没有教学内容的深化。此外,一些教材并没有突出知识特色,不同教材中有内容重复章节,这样会增加学生的学习负担,降低学习兴趣。
2“大数据”背景下生物信息学教学质量提高
生物信息学专业教学难度大,对专业知识要求较高,教学任务艰巨。要保证良好的生物信息学教学质量,顺应生物医学领域飞速发展的潮流,培养优秀的生物信息学专门人才,笔者认为需要从以下几个方面改进:
2.1合理安排教学进程
在生物信息学专业学习的前两个学年,课程设置主要以基础课程为主。以本校为例,生物信息专业学生在大一、大二学年主要学习一些医学基础课程并辅助开展计算机基础课程,例如生物化学、分子生物学、生理学、C语言简介等,在学习基础课程的同时对专业方向有一个简要的了解。在大三学年可以增设一些生物信息学专业课程,例如:模式识别、数据挖掘、生物数据可视化等。在这个学习阶段,学生没还没有进入到毕业设计阶段,研究课题方向还没有确定,通过专业课程的学习不但可以帮助学生掌握生物信息学必备技能,还可以帮助学生明确今后课题研究方向。此外,这一阶段学生们刚刚掌握医学基础知识,正是对专业知识渴求的良好时机,学习兴趣浓厚。此时开设生物信息学专业课程可以取得较好的教学效果。生物信息学是一门飞速发展的学科,相关知识及数据资源在不断更新。因此,在毕业设计阶段,可以开设生物信息学进展课程,聘请著名专家学者为同学们讲授当前生物信息学领域最新进展,使同学们始终把握生物信息学前沿,培养创新思维。
2.2建立完善的教材体系
参考国内外生物信息学教材,对众多优秀的教材进行归纳总结,吸取其优点,对重复内容进行整理,结合本校学生知识背景及培养方向编写生物信息学特色教材。同时将生物信息学领域新方法、新资源、新思路及时编入教材,替换老旧内容。例如一些教材中列举了常用的生物信息学数据库,其中部分数据库已经更新到新的版本,相关访问网址、查询方式等也随之发生变化,而这些内容在一些教材上并没有得到更新。伴随着高通量测序技术的快速发展,一些测序平台产生的大数据也再不断被发布,想要做到根据生物信息前沿进展随时修改教材是一件不可能的事。因此,生物信息学教学也不应仅限于教材,对于知识进展、前沿动态、数据发布等领域内最新成果,教师应当自己制作相关课件,紧跟时代的步伐。这样才能及时将最新、最全、最正确的知识传授给学生。
3结语
随着基因组学研究的不断深入以及高通量测序技术的迅猛发展,生物医学研究领域迎来了一个崭新的“大数据”时代。各大平台检测产生多组学海量生物数据的存储、分析、发布等问题亟待生物信息学来解决。生物信息学作为当前高新热点领域之一,与现代生物医药发展存在密切联系,对科研成果向经济产业转化具有重大的推动意义,生物信息学人才培养以及教学方案也在不断探索中前进。
参考文献
[1]Hogeweg P. The roots of bioinformatics in theoretical bioloby. PLoS Comput Biol. 2011;7(3):e1002021
4.生物信息学(第二版) 篇四
D.R.Westhead,J.H.Parish & R.M.Twyman
科学出版社2004
A生物信息学概述
相关学习网站plexes)的形成。了解这些复合物对于注释蛋白质功能是必需,也是解释信号级联和调控网络等分子途径的一个步骤。死效应反映了两个突变的蛋白质
2.遗传方法
抑制子突变体可以通过恢复被破坏的蛋白质互作来补偿有害的原始突变体。而合成致死效应反映了两个突变的蛋白质不能相互作用,显性负突变(dominant negative mutation)显示了一种起着多聚复合体作用的蛋白质。
3.亲和性方法
可通过几种利用蛋白质亲和性(特异结合的倾向)分析的物理方法来为蛋白质之间的相互关系提供直接的证据,比如亲和性管柱层析法,免疫共沉淀。由Ciphergen公司使亲和实验格式更趋微型化,使得在蛋白质芯片的发展中达到顶峰。
4.分子和原子的方法
X射线晶体学和核磁共振谱有助于在原子水平识别蛋白质互作,其它的蛋白质互作分析的分子方法包括荧光共振能量传递(FRET),表面基元共振谱(SPR)和表面增强激光接吸附/离子化技术(SELDL),其中的很多方法可通过质谱技术直接集成到蛋白质注释中。
5.基于文库的方法
基于文库的蛋白质互作实验有两个主要优点:它是高度并行的实验格式;候选互作蛋白质及其cDNAs之间直接关联。
影响最大的方法是酵母双杂交系统(yeast two-hybrid system,Y2H),在这个系统中蛋白质通过识别与之连接的一个功能转录因子进行互作。
C数据库--内容,结构和注释
已注释的序列数据库
1.初级序列数据库
GenBank(NCBI)、核酸序列数据库(EMBL)和日本的DNA数据库(DDBJ)
2.SWISS-PROT和TrEMBL
SWISS-PROT收集了确认的蛋白质序列及与结构,功能和所属蛋白质家族有关的注释信息。相关数据库TrEMBL翻译了初级核酸数据库中的编码序列。
其他数据库
1.OMIM
OMIM指人类孟德尔遗传的联机数据库,用于研究人类遗传学和人类分子生物学的强大资源。每个OMIM条目都有一个对特定基因或性状的已知信息的全文总结,并有指向初级序列数据库和其它遗传学资源的链接。
2.Incyte和UniGene
Incyte是商业数据库,它提供了基因序列和专家注释的记录,这是专门为药物研究开发服务的数据库。UniGene是一种用来把GenBank序列聚类并与EST数据相关联的实验工具。
3.结构数据库
蛋白质数据库(PDB),核酸数据库(NDB),大分子结构数据库(MSD)
E通过序列相似性标准搜索序列数据库
序列相似性搜索
1.序列联配
序列联配是是相似度量化的第一步,用来区分偶然性的相似和真实的生物学关系。联配结果以变化(突变)、插入或缺失(或空位indel)来显示序列之间的差异,这些差异可以用进化术语来说明。
2.联配算法
动态规划算法可以计算两条之间的最佳联配,其中广泛使用的算法有Smith-Waterman算法(局部联配)和Needleman-Wunsch算法(全局联配)。
3.联配分支和空位罚分
用简单的联配分值来测量相同匹配残基的比例或数目。得从联配分值中扣去空位罚分,以保证联配算法能得出有生物学意义的结果而没有太多的空位。
数据库搜索:FASTA和BLAST
1.统计分值
相似度记分的P值是指获得至少与两条无关序列间的偶然相似性一样高的分值的概率。低P值表明重要的匹配,这些匹配可能会有真实生物学意义。相关的E值(期望值)是至少与所识别的相似性记同样高分值的偶然事件的期望概率。两序列见相似度的低P值对应于大数据库搜索的高E值。
2.敏感性和特异性
敏感性衡量数据库中真实生物序列关系的比例,该关系表现为击中项(有意义的相似序列)。特异性指的是对应于真实生物学关系的击中项的比例。改变E和P的默认值会导致这些互补的优良度测量方法之间的平衡。
F多序列联配:基因和蛋白质家族
多序列联配和家族关系
1.多序列联配
多序列联配表明两条或两条以上序列之间的关系,可以解释关于蛋白质结构和功能的许多线索。当所考察的序列不同时,保守的残基往往是维持稳定结构或生物学功能的关键残基。
2.渐进联配
渐进联配方法以两序列联配来初步评价序列是如何相关的,并在这个基础上构建向导树,然后使用向导树逐步添加序列到联配中,从最密切相关的序列开始到距离最远的序列结束。
蛋白质家族和模式数据库
1.蛋白质家族
把序列分配到蛋白质家族中是预测蛋白质功能是非常有价值的方法。多序列联配信息的表示方法有很多种,包括联配本身、一致序列、保守残基和残基模式、序列轮廓以及其他的序列家族的概率模型。这些根据不同的应用都有不同的用途,其中大多数已经被开发和存储在数据库中,里面含有大量不同蛋白质家族的信息,这样的数据库称为二级数据库。
2.一致序列
这些序列把多序列联配的信息压缩至单条序列,主要的缺点是除了在特定位置最常见的残基之外,它们不能表示任何概率信息。一致序列的产生说明了任何蛋白家族的表示都是有偏向的,这主要是由于来源的序列集是有偏向的。
3.PROSITE
PROSITE数据库包括与蛋白质家族成员、特定蛋白功能及翻译后修饰有关的序列模式。PROSITE模式与一致序列的不同在于,它们往往比序列全长要短得多,并且给出了一种描述多序列联配中一套可接受的残基组合的方法。PROSITE模式中已知的假阳性(或假阴性)都已经在数据库中注明。PROSITE数据库在某些条目含有序列轮廓,以尝试描述比模式更长的序列片段(通常指整个结构域)。
4.PRINTS和BLOCKS
PRINTS和BLOCKS是密切相关的,它们分别通过来自一组蛋白或蛋白家族中最高度保守区域的多序列联配无空位片段的形式来表示蛋白质家族。
蛋白质结构域家族
1.结构域家族
许多蛋白质是由模式结构的结构域组建的,因此蛋白质家族的研究其实是对蛋白质结构域家族的研究。
2.序列轮廓
序列轮廓(也成权重矩阵)是一种描绘蛋白质结构与家族相关序列的方法,其优点是描述了结构域序列的全长,包括观察到每个氨基酸的可能性,以及序列每个位点插入和缺失的可能性。
3.隐马尔科夫模型
隐马尔科夫模型(HMMs)是蛋白质结构域家族序列的一种严格的统计模型,包括序列的匹配、插入和缺失状态,并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。代表某蛋白结构域家族的模型从该家族中生成序列的概率较高,从其他家族中生成序列的概率较低。
J微阵列数据分析
微阵列数据:分析方法
1.微阵列原始数据
微阵列数据就是经过杂交的阵列的扫描图像,扫描图像显示每一个点的杂交信号强度。这些图像可通过单通道、双通道荧光标记、同位素标记或比色标记等方法获得,其记录方式各不相同。
2.数据质量
准确记录个点的信号强度是微阵列数据分析的基本要求,DNA阵列可包含数千个特征点,因此数据的获取和分析必须自动进行。阵列上必须包含对照点以衡量非特异杂交和不同
阵列上杂交的多变性。
3.基因表达矩阵
从微阵列实验得到的原始数据首先要转换成表,即基因表达矩阵。表中的各行代表基因,各列代表不同的实验条件,表中的数据为信号强度,代表各个基因的相对表达水平。
4.表达数据分组
基因表达矩阵中的每一个基因都有其特定的表达模式,即一系列条件下基因表达情况的测量值。微阵列数据分析就是要将这些数据按表达模式的相似程度进行分类。
序列采样和SAGE
1.序列采样数据分析
差异基因表达的研究,可以通过从不同的cDNA文库中随机挑取克隆来进行,也可以通过抽取EST数据来进行。这种分析需要抽取成千上万的序列以达到统计上的显著性,即使对于中度冗余度的mRNA也要如此。
2.SAGE
5.北大生物信息学硕士培养计划 篇五
(试 行)
一、培养目标
1.较好地掌握马克思主义、毛泽东思想和邓小平理论,拥护党的基本路线,热爱祖国,遵纪守法,学风严谨,品行端正,有较强的事业心和献身科学的精神,积极为国家现代化建设服务;
2.掌握一门外国语,具有坚实宽广的与生物信息学跨学科研究相关的生物学以及计算机与信息科学方面的理论基础;
3.在生物信息学跨学科研究的某一领域掌握较系统的专门知识、技术与方法,能够运用所掌握的基础理论与专门知识解决科学研究或实际工作中的问题,具有从事教学与科学研究工作和其他实际工作的能力。
二、研究方向与指导教师(暂略)
三、招生、入学考试和学习年限
1.招生对象
生物学、数学、化学、物理学、计算机与信息工程科学类大学本科毕业生或同等学力者,以及具备较好相关知识背景的其它学科的大学本科毕业生。
2.入学考试
参加全国研究生招生统一考试。考试科目为政治理论课(理)、外语、专业基础课和专业课(专业基础课和专业课考试科目,包括生物学、数学、计算机科学与技术、物理学、化学等相关学科的课程,可根据报考者的学历背景及其报考导师的专业领域等情况进行选择)。
3.学习年限
三年
四、课程设置
生物信息学跨学科研究方向硕士研究生课程设置包括以下四个部分:
(一)公共必修课
(1)科学技术哲学与政治理论课
(2)第一外国语
(二)专业必修课(核心课程)
概率论与数理统计
数据库概论
普通生物学
生物信息学概论
生物化学与分子生物学
遗传学与细胞生物学
生物信息学研究中的数学方法
(三)讨论班与前沿讲座课(必修课)
生物信息学跨学科研究方向硕士研究生须参加讨论班与前沿讲座课程的学 1
习达四学期。每学期参加讨论班与前沿讲座课学习至少7次以上,记1学分;四学期共计4学分。
(四)选修或补修课
1.计算机科学
数据结构
数据库原理与技术
数据库进展与新技术
程序设计语言
(一)程序设计语言
(二)计算机程序设计与技巧
操作系统概论
2.数学
高等概率论与数理统计
高等统计学
随机过程论
组合数学
信息论与信号处理
算法设计与分析
算法研究
3.生物学与医(药)学
现代生物学概论
生物统计学
分子和细胞生物学
现代生物化学与分子生物学研究技术
蛋白质化学与工程
分子免疫学
生物英语
4.物理学
群论
量子力学
5.化学
量子化学
统计热力学
分子设计方法的原理及应用
生物信息学跨学科研究方向硕士研究生须依照培养方案修满39学分。其中:公共必修课7学分,专业必修课(核心课程)10学分,讨论班与前沿讲座课4学分(必修),选修或补修课16学分;学位论文选题报告2学分。
如果生物信息学跨学科研究方向硕士研究生按照培养方案所修课程为学校面向本科生开设的主干基础课程,成绩合格,则计入学分。
五、科学研究与学位论文工作
生物信息学跨学科研究方向硕士研究生在入学一年到一年半时间内,应按照培养方案修完除讨论班与前沿讲座课程以外的其它所有必修课、选修或补修课,并完成学位论文选题报告,用一年半到二年的时间从事与其专业研究方向相关的科学研究与学位论文工作。科学研究与学位论文工作可大致分为三个阶段:学位论文选题报告;科学研究工作的开展;学位论文写作与申请答辩。
六、其它
6.伦敦大学国王学院生物信息学硕士 篇六
伦敦大学国王学院生物信息学硕士 课程简介:生物信息学是一个多学科的课程,包括与储存,组织和分析大量可用的生物分子数据相关的计算机工具的研究,开发和应用,为生物技术,医药行业和更高级的研究工作培养优秀人才。课程特色1:由生物医学和健康科学院,医学院和自然科学及数学科学学院的优秀老师教学的跨学科课程。课程特色2:均衡整合计算机,生物和医药各方面的课程。课程特色3:在生物信息学在自然与数学科学院和生物医学和健康系的生物信息学专家监管下,本课程可以使用先进设施并进行尖端项目研究 适合群体:适合准备从事生物技术和医药行业或进一步深造的学生。课程设置(基本模块):• Algorithm Design and Analysis 运算设计和分析,Algorithms for Computational Molecular Biology计算机分子生物学运算 课程设置(特色模块):Fundamentals of Genetics and Biomolecular Structure for Bioinformatics*生物信息学中的遗传学和生物分子的基本结构(此课程对有计算机科学专业背景的学生是必修课程),Statistics for Bioinformatics*生物信息统计学,Data Analysis of Large-Scale Experiments in Molecular Biology* 大型分子生物实验数据分析,Structural Bioinformatics and Protein Structure Predictions* 生物信息结构和蛋白质结构预测,Genetic Data Analysis in Medicine*医学中的遗传数据分析 奖学金及申请条件: 考核方式:8个教学模块通过书面考试考核,小组作业之类的课程以最终报告为评估依据,课程作业,个人项目作业(个人项目作业为获得MSc学位的必要条件,未完成项目作业的学生将获得硕士文凭)。就业方向:生物技术行业,学界和业界的生物工程研究;通用软件咨询公司,特殊软件开发公司,国企或私企等大型机构的IT部门。学生还可以决定继续攻读计算机科学或生物信息学博士学位。最佳申请时间:建议入学前一年开始申请 学习课程收益:学会了计算分子生物学,蛋白质结构分析和预测的运算设计和分析,生物信息统计,技术数据分析,蛋白质/基因相互作用关系;系统生物。此外,具有生物学背景的学生将引进学习编程和计算机科学,而具有计算机背景的学生将引进学习分子生物学知识。是否可雅思豁免:否 内部语言测试:无
7.数据挖掘在生物信息学中的应用 篇七
生物信息学的产生和发展是以生命科学研究数据的海量增长和信息科学技术的迅猛发展为前提的。由于生物数据具有种类丰富、高通量、维数高等特点, 传统的分析方法的能力和速度远不能满足实际的应用, 生物数据的分析成为生物研究的瓶颈, 其处理、挖掘、分析和理解日益迫切。在生物信息学的研究中, 核酸和蛋白质序列是生物信息学研究的核心内容, 人们试图通过研究蕴涵丰富遗传信息的序列数据来揭示生命的内涵和奥秘。数据挖掘等决策支持技术, 因其在大规模数据处理方面的卓越能力, 在对生物数据分析和处理中占据的地位越来越重要。
1 生物信息数据库现状
近年来随着快速序列测定、基因重组、多维核磁共振、同步辐射、机器人等技术的应用, 生物学实验数据呈爆炸趋势增长, 形成了数百个活动的生物信息数据库, 它们各自按一定的目标收集和整理生物学实验数据, 并提供相关的数据查询、数据处理等服务。生物信息数据库大多可以通过网络来访问, 或者通过网络下载。同传统的数据库系统不同, 生物信息数据处理软件的特点有:数据既包含数字、字符等传统的数据类型, 又包含序列、三维结构数据等新的数据类型;对数据的访问以查询操作为主, 完成单次查询需要访问大量的数据;系统需要支持各种特殊查询要求。为此需要对数据库系统的系统结构进行进一步改进, 研究不同类型数据的混合处理方法, 特别是需要保证对传统数据类型的高查询性能的基础上, 对新的数据类型和查询操作具有灵活的扩展能力。
生物信息学数据库目前主要包括: (1) 核酸序列数据库:用于核酸分析的数据库主要有GenBank、EMBL、DDBJ等3大数据库; (2) 蛋白质序列数据库:蛋白质序列数据库主要有SWISS-PROT。它经过人工校验, 只收录已知蛋白质序列, 并且每一条数据均有详细注释, 包括功能、结构域、翻译后修饰以及一些相关的综述; (3) 结构数据库:结构数据库主要包括蛋白质结构、核酸结构、小分子数据库等, 这里就重要的蛋白质结构数据库加以介绍; (4) 基因组数据库:基因组数据库根据物种类别可以分为很多种, 而文中提及的主要是人类基因组。
2 数据挖掘技术
数据挖掘 (Data Mining) 是从数据库中识别出有效的、新颖的、潜在有用的并且最终可理解模式的非平凡过程。数据挖掘过程通常包括如下几个步骤:数据清理、数据集成、数据选择、数据变换、挖掘、模式评估、知识表示。数据挖掘是数据库技术、机器学习以及统计学等多学科交叉的产物, 因此, 数据挖掘继承了以上学科的相关理论和方法。数据挖掘的对象包括:文件、关系数据库、异种和遗产数据库系统、数据仓库、多媒体数据库、空间数据库、时间数据库、序列数据、Web、文本等。数据挖掘任务一般包括描述和预测。而数据挖掘所得到的模式主要有:关联分析、分类、回归、聚类分析、孤立点分析、趋势与演化分析等。
3 数据挖掘技术在生物信息学中的应用
生物信息学中除了对大量的生物数据进行编码分析外还需要对数据进行提取操作。数据挖掘技术中用于数据提取的方法有:分类、回归、聚类、频繁模式发现和可视化等。在生物信息学中的应用领域有:更好地理解基因表达谱、基因功能预测、分子结构关系预测和先导分子优化等。使用数据挖掘技术的优势在于避免了数据缩减、完全集成分析、将图像和文本转化为可以挖掘的数据格式等。
发现基因表达序列中频繁模式的问题是目前生物信息学中的热点基础研究问题之一。借助数据挖掘技术来分析基因表达数据相似性度量, 提出以波动相似性为依据的相似性度量函数。数据挖掘技术有助于构造基因表达谱芯片数据库设计框架。基因芯片数据分析涉及芯片实验的整个过程, 相关数据包括数据实验设计、芯片设计、样本信息、杂交过程与处理数据等等, 满足数据分析和数据共享需要的基因芯片数据库是一个未解决的难题, 现有的框架原则只是建议标准。根据需要具体设计芯片数据库, 并在数据挖掘系统中应用, 基本满足分析需要, 得到主要的分析期望, 提取基因表达相似性分析模型、基因表达路径分析、基因表达路径分析副路径分析等分析模型。综合这些研究, 可进一步完善基于生物信息数据挖掘应用平台系统架构, 使用基于框架原则的数据库, 采用数据挖掘技术映射分析模型, 设计基因表达谱芯片数据挖掘, 具有良好的伸缩性和实体独立性, 能覆盖芯片的分析期望。
生物信息学的大量研究都集中在DNA数据的分析上, DNA分析的研究成果已经导致了对许多疾病和残疾的基因成因的发现, 以及对疾病的诊断、预防和治疗的新药物、新方法的发现。基因研究中的一个重要关注点是DNA序列的研究。所有的DNA序列由四个基本的构块 (称为核苷) 组成:腺嘌呤 (A) 、胞核嘧啶 (C) 、鸟嘌呤 (T) 、胸腺嘧啶。这4个核苷组合构成很长的序列或链, 类似一个双螺旋梯。由于在数据挖掘中已经有许多有意义的序列模式分析和相似的检索技术, 因此数据挖掘成为DNA分析中的强有力工具, 并在异构、分布式基因数据库的语义集成、DNA序列间相似搜索和比较、关联分析、可视化工具和遗传数据分析等方面对DNA分析起作用。
4 结束语
生物信息学是一门交叉学科, 是对生物科学所产生的大量数据进行分析和管理的学科, 重点发展方向之一就是生物数据的获取、生物信息的加工和利用, 其攻关方向是基因研究和相关信息分析、功能基因组信息分析等。其中, 数据挖掘技术的应用研究是解决问题的关键。数据挖掘技术在生物信息学领域仍然有很多问题需要解决, 但具有良好的研究与应用前景。
参考文献
[1]陈铭.后基因组时代的生物信息学[J].生物信息学, 2004 (2) .
[2]Jiawei Han, Micheline Kamber.数据挖掘概念与技术[M].范明, 孟小峰, 译.北京:机械工业出版社, 2001.
8.生物信息学名词解释 篇八
【关键词】生物信息学 研究进展 蛋白质组学 应用
【中图分类号】Q51-33 【文献标识码】A 【文章编号】2095-3089(2016)10-0061-02
1.引言
生物信息学是在计算机科学、数学与生命科学等多门学科的基础上发展形成的一门新兴交叉学科。人类基因组计划(HGP, human genome project)的圆满完成极大地推动了生物信息学的发展,与此同时,多种模式生物如大肠杆菌、酵母、线虫、拟南芥、水稻、玉米等的基因组计划也都相继完成。随之而来的是包括DNA、RNA及蛋白质片段等在内的分子数据的爆炸性增长,这一切形成了生物学数据的海洋。我们需要从大量的生物数据中挖掘出为我们所用的知识和信息,由此催生了生物信息学这门学科的产生和发展。
生物信息学包含了生物信息的获取、处理、储存、分析和解释等方面,集合数学、统计、计算机与生物医学等工具研究,阐明大量生物学数据所包含的生物学意义。通过对生物信息的查询、搜索、比较、分析,从中获取基因编码及调控、核酸和蛋白质结构功能及其相互关系等知识,从而探索生命的奥秘。
蛋白质组(proteome)的概念于1994年被提出[1],指全部基因表达的全部蛋白质及其存在方式,是一种细胞、组织或完整生物体在特定时空上所拥有的全套蛋白质[2]。蛋白质组具有复杂多变的特点,蛋白质的种类数量即使在同一生物体相同细胞中在不同时期和环境下也是不同的。蛋白质组学是研究蛋白质组及大范围蛋白质的分离、分析、应用的学科。早期蛋白质组学的研究范围主要指蛋白质的表达模式,如今,蛋白质翻译后修饰研究已成为蛋白质组研究中的重要部分和巨大挑战,蛋白质与蛋白质相互作用的研究也已被纳入蛋白质组学的研究范畴。
2.生物信息学的发展
生物信息学的发展基础是各种数据库的建立和不断完善。目前国际上有三个主要的关于蛋白质和核酸的公共数据库,它们分别是美国国立生物技术信息中心(NCBI,http://www.ncbi.nlm.nib.gov)、欧洲生物信息学研究所(EBI,http://www.ebi.ac.uk)和日本信息生物学中心(CIB,http://www.ddbj.nig.ac.jp)。这三个重要数据库随着生物信息学的发展及时更新,为生物信息学的发展提供数据平台。后基因组时代的到来引导人们研究重点向功能基因组的转移。研究内容也扩展到生命现象的核心,即从基因、蛋白质研究生命的本质,理解功能、发育与疾病的关系[3]。计算机技术的进步,导致根据不同的科研需要构建相应的网络资源平台、生物分析软件应运而生,为生物信息学的发展提供新技术支持。
3.生物信息学的研究内容
3.1 序列比对
序列比对是两个或者两个以上序列进行比较发现其间的相似性或者不相似性。生物信息大多通过自身的序列表现出来,人类由于生理条件限制,对庞杂数据的分析是有限的,需要借助于计算机的程序来进行序列间的比对,由此发现生物规律。例如,氨基酸序列的比对可以分析特定位置氨基酸的差异和整个序列中不同氨基酸的比例,统计氨基酸序列的突变率和替代率,比较序列之间的同源性和一致度。核酸序列(DNA和RNA)比对可以显示序列间核苷酸的差异,估计进化距离[4]。氨基酸序列和核苷酸序列都可以进行基于计算机程序的序列比对,不仅有助于我们进行序列同源性的分析,还可以研究某一物种的进化。
序列比对是生物研究的基础。对于不同的序列比对有不同的算法和模型,实际应用中应根据不同的研究目的进行选择。两两序列比对已有较成熟的动态规划算法,以及在此基础上编写而成的比对软件包BLAST和FASTA。有时两序列整体相似性不高,但是局部区域很相似。Smith-Waterman算法是解决局部比对的好算法。
3.2蛋白质分析及结构预测
生物大分子蛋白质是生命活动重要的物质基础。蛋白质的生物信息学研究,主要集中在蛋白质的理化性质分析、序列分析、高级结构预测、蛋白质功能分析以及蛋白质与蛋白质之间的相互作用。蛋白质理化性质的分析主要包括等电点预测、疏水性和跨膜区分析以及二级结构(α螺旋、β折叠、无规卷曲等)预测,这些性质可以在瑞士生物信息研究所(http://www.expasy.ch/)的相关网站进行分析和预测。蛋白质的三级结构可以用X射线衍射技术、核磁共振技术、三维电镜重构技术来进行测定,但是这些技术耗时长,代价高,并不能成为生物实验室的常规研究手段。生物信息学的发展极大地提高了蛋白质的三维结构测定效率。从方法来看有演绎法和归纳法两种。演绎法主要是从一些基本原理或假设出发来预测蛋白质的结构。后者主要是从观察和总结已知结构的蛋白质结构规律来预测未知的蛋白质结构。同源建模属于这一范畴。人们可以根据软件进行预测,根据同源建模的原理,根据已通过实验测定的蛋白质结构来预测未知的蛋白质结构。虽然经历了漫长的时间和努力,蛋白质的结构预测现状还仍然满足不了如今的科研需要。生物信息技术的发展为实验提供了简单快速的研究方法,开创了新的研究道路,研究蛋白质与蛋白质相互作用也为新药的研发、探明微生物的致病机理提供研究思路[5]。
3.3系统发育分析
系统发育分析是生物信息学的重要分支之一,它根据大量的分子数据,对不同基因或DNA片段分析发现它们之间的进化速率所存在的差异,利用这些差异来研究物种的形成或进化历史,以及有机体之间的进化关系[6]。由于分子数据的获取比生物化石的数据容易,而且计算机的强大功能为处理庞大数据提供了可能,因此随着分子数据的大量积累,各国的研究人员都利用克隆分子片段,结合形态学分析对科、属、种以及种内的物种进行鉴定,并进行系统发育的分析研究。但是,完全通过计算机来研究整个自然界中准确的物种进化是不现实的,构建的系统发育树有时甚至存在严重错误,所做的也只是一个模拟,并不是绝对的真实情况。
4.生物信息学在蛋白质组学上的应用
4.1蛋白质的理化性质分析
从蛋白质的一级序列出发,预测蛋白质的许多理化性质,包括分子量、等电点、酶切特性、疏水性、电荷分布、稳定性等。相关工具有:1)Compute pI/MW(预测等电点和分子量)。对等电点pI的预测是根据早期研究中将蛋白质从中性到酸性变性条件下迁移过程所获的PK值。但是该种预测对碱性蛋白有限制,计算出的等电点可能不准确。2)PeptideMass(分析酶切特性)。主要针对肽段图谱的分析试验,分析蛋白质在各种蛋白酶和化学试剂处理之后的内切产物。3)SAPS(分析蛋白质电荷分布)。蛋白质序列统计分析,对提交的序列给出大量全面的分析数据。最后给出高疏水性和跨膜区域、重复结构和多重态以及周期性分析。
4.2蛋白质的结构分析预测
蛋白质的结构分析包括二级结构分析和三维结构预测。蛋白质的二级结构是指α螺旋和β折叠等规则的蛋白质局部结构元件。一段氨基酸残基根据其自身的理化性质具有形成不同二级结构元件的倾向和规律。也就是说,蛋白质二级结构的分析和预测就是找出这种倾向或规律。一般来说,二级结构预测中,α螺旋的预测效果相对较好,比较准确,而对β折叠的预测精准度要低很多。蛋白质三级结构预测是结构预测过程中最复杂、最困难的一步。虽然蛋白质三级结构是在一级结构及二级结构的基础上进行折叠的,但是其折叠机制并没有被研究透彻。一级氨基酸序列差异较大的蛋白质也能折叠形成相似的三维结构,例如,泛素和Sumo蛋白,两者的氨基酸序列相似度很低,但是具有高度类似的三维结构。但是,蛋白质的折叠也不是没有规律可循。生物信息学技术的发展使得一些预测蛋白质三级结构的方法越来越成熟。通过与已知结构的氨基酸序列比较,来预测未知蛋白的结构。常见的预测方法:SWISS-MODEL、CPH模型等。
4.3蛋白质功能分析
生物信息学的迅速发展不仅体现在对蛋白质数据的分析和预测方面,而且可以对蛋白质的功能进行较全面的分析和预测。蛋白质功能分析主要基于序列中含有的特征性结构域来识别蛋白质的相关功能。以未知蛋白为例,可以通过序列比对,分析其序列中的经典结构域或基序,然后在已知蛋白质的相关数据库中进行结构域或基序的搜索,借此来确定未知蛋白的类型及功能预测[7]。
蛋白质调控着细胞内大部分的生理过程,而作为基因产物的蛋白质并不总是被表达翻译出来,因为部分基因只有在特定生理环境和细胞周期阶段才能表达,并合成蛋白质。而有些基因在人工模拟环境下是不能表达的,那么其蛋白质产物就无法被经典的实验技术研究。但是,运用生物信息学技术可以对这类未知蛋白质进行计算分析和预测,从而获得其生物学功能[8]。
参考文献:
[1]Wilkins MR, Pasquali C, Appel RD, et al. From proteins to proteomes: large scale protein identification by twodimensional electrophoresis and amino acid analysis. Biotechnology(NY).1996 Jan;14(1):61-5.
[2]Gould KL, Ren L, Feoktistova AS, et al. Tandem affinity purification and identification of protein complex components. Methods. 2004 Jul; 33(3):239-44.
[3]乔纳森.佩夫斯纳,著,张之荣,译. 生物信息学与功能基因组学[M].北京:化学工业出版社, 2006.
[4]Masatoshi Nei, Sudhir Kumar,吕宝忠,译. 分子进化与系统发育[M]. 北京: 高等教育出版社, 2006.
[5]任仙文,李北平. 蛋白质相互作用的生物信息学研究进展[J]. 生物技术通讯, 2006, 17(6): 976-980.
[6]张树波,赖剑煌. 分子系统发育分析的生物信息学方法[J]. 计算机科学, 2010, 37(8): 47-51.
[7]黄丽俊,王建华. 蛋白质组研究技术及进展[J]. 生物学通报, 2005(8): 4-6.
[8]Hagen JB. The origins of bioinformatics. Nat Rev Genet. 2000 Dec; 1(3):231-6.
作者简介:
9.生物信息学名词解释 篇九
后基因组时代生物信息学的发展趋势
介绍生物信息学产生背景、发展过程以及研究现状,讨论了后基因组时代分子生物学的主要研究领域功能基因组学、蛋白质组学、比较基因组学、药物基因组学之间的关系.在分析基因组时代和后基因组时代生物信息学所研究内容的差异基础上,说明了基于分层递阶结构的系统结构、特征分析方法以及相应的`软件系统开发将成为生物信息学发展的基本趋势之一.
作 者:唐旭清 朱平TANG Xu-qing ZHU Ping 作者单位:江苏省无锡,市江南大学理学院,江苏无锡,214122刊 名:生物信息学 ISTIC英文刊名:CHINA JOURNAL OF BIOINFORMATICS年,卷(期):6(3)分类号:Q343.1关键词:生物信息学 后基因组时代 分层递阶结构
10.生物信息学名词解释 篇十
科技的进步推动社会的发展,又推动各个领域的发展。在醫学领域,生物学和基因工程学在现代科学技术的推动下,产生了许多新的理论与概念。融合了生物学和基因工程学而产生的新兴学科——生物信息学,能够对数量庞大、结构复杂的生物信息组数据进行管理和分析。可以说生物信息学的出现是对现代医药学发展的一个巨大助力。现代中医学发展进入一个新的阶段。相对以前,人们对中医学的重视程度大大提升。中医学发展进入新的时期。将中医学与生物信息学进行融合,是对传统中医学进行的一次伟大尝试。生物信息学能够弥补中医学中在微观层次上研究的不足。中医学与生物信息学在现阶段如何进行进一步的融合,未来又有怎样的发展空间值得深入的思考。生物信息学应用到中医学领域,不只对中医学在临床方面的发展有着推动,在中医制药方面也有着巨大帮助。
1生物信息学发展现状
11.生物信息学名词解释 篇十一
关键词:UCPl基因;新西兰兔;加利福尼亚兔;SNPs;RNA二级结构
中图分类号:S829.12 文献标志码:A 文章编号:1002—1302(2016)01—0041—03
解偶联蛋白(uneouplingprotein,UCPs)是褐色脂肪细胞线粒体内膜上存在的一种质子转运蛋白,它存在于动物的各组织中,在能量平衡、维持体温、机体产热和代谢等方面都起着巨大的作用。比如,它激活后可以产生质子电化学梯度降低,使呼吸链与ATP(三磷酸腺苷)合成过程解耦联,使能量以热的形式释放;UCP1基因参与机体能量代谢,对机体能量平衡涉及的食物转化效率、静止代谢率和体重肥胖等性状具有明显的效应,对肌肉生长和品质的改良作用重大。目前,这个家族的5种蛋白质在鱼、禽类、哺乳动物甚至在人类的不同组织线粒体的内膜上都已发现。其中,UCP1是最早发现的成员。
UCP1是褐色脂肪组织(brown adipose tissue,BAT)中表达的标记基因,它具有解离氧化磷酸化耦联功能,如机体通过在线粒体中产生能量,三羧酸循环产生的还原当量通过电子将能量释放,使H+从线粒体基质转移至内膜面,形成1个跨线粒体内膜的质子电化学梯度,当线粒体的ATP合酶将H+从内膜面顺梯度运回至基质面时,其能量可推动二磷酸腺苷与磷酸结合,促使生成ATP。UCP1基因的表达增加可能是受到去甲肾上腺素促进,使其与G偶联蛋白相关的环磷酸腺苷合成,后者又可使蛋白激酶激活,蛋白激酶作用的靶蛋白包括激素敏感性脂肪酶,这种酶一旦被磷酸化激活就可以抑制三酰甘油的贮存,使脂肪分解,非脂化脂肪酸增加,促进产热作用。此外,UCP1表达增加还有可能受肾上腺素和甲状腺素等的刺激,从而增加棕色脂肪组织所消耗脂肪酸的活性,因此UCPl被认为是2型糖尿病和抵抗肥胖的重要基因。
Clark等发现,UCP1基因的表达水平对羔羊出生后的成活率起着重大作用。Bassett等发现,UCP1基因的表达对初生羔羊BAT的含量影响重大。然而对兔线粒体中UCP1基因方面的研究很少,本试验以加利福尼亚兔和新西兰兔构建其DNA池,对UCP1基因第5外显子及第4内含子部分序列进行扩增,BLAST分析其测序结果筛选多态位点,由DNAStar软件进行序列拼接、校正,并预测其对RNA结构影响和等位基因频率估算。
1材料与方法
1.1样品的来源
从贵州贵阳白云牛场大林农牧专业合作社种兔场和贵州贵阳修文盛鑫兔业开发有限公司种兔场采取加利福尼亚兔的组织样48个和新西兰兔组织样48个,将采取的样品放在已编好序号的自封袋中于-20℃冰箱中保存。
1.2构建DNA池和引物设计、合成
利用磁珠法动物基因组(组织)DNA抽提试剂盒提取DNA,用1.0%琼脂糖凝胶电泳检测所提的DNA,取5μL构建DNA池。以兔UCPl基因(其GenBank登录号为:NC_013683.1)DNA序列利用Primer-BLAST设计1对引物来扩增UCPl基因第5外显子和第4内含子的部分序列,将所设计的引物送往生工生物工程(上海)股份有限公司合成。物序列为F:GAGGTAAGTCCATCCCCACG,R:ACTCTTCTA-ACGATGTAGTGTC;退火温度为59℃;目的片段大小为809 bp。
1.3 DNA的扩增和序列的分析
反应体系为25μL:2×Taq PCR Master Mix试剂12.5μL,基因組DNA 2.5μL,三蒸水7μL,上、下游引物10 pmol/μL各1.5μL。PCR扩增条件为:94℃预变性5 min;95℃变性30 s,59℃退火30 s,72℃延伸30 s,35个循环;72℃延伸10 min。用1%琼脂糖凝胶电泳检测PCR产物,并用凝胶成像系统观察结果,最后拍照保存。
将扩增的产物送往立菲生物技术有限公司进行双向测序。用DNAStar软件校正测序结果,通过BLAST软件对SNPs进行确定。
1.4测量峰高及等位基因频率估算
利用MWSnap软件对SNP位点等位基因的相应峰高进行测量,可依据如下公式fi=hi/(h1+h2),i=1,2,对等位基因频率进行估算。fi表示SNP位点某等位基因频率,h1表示SNP等位基因1峰的高度,h2表示SNP等位基因2峰的高度。
1.5 RNA二级结构预测和蛋白质二级结构预测
通过在线预测软件:http:∥rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi,对UCPl基因突变前后不同DNA序列进行RNA二级结构变化的预测,通过蛋白质二级结构在线预测软件:https:∥npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html,对UCPl基因突变前后不同蛋白氨基酸序列进行蛋白质二级結构预测。
2结果与分析
2.1 PCR产物扩增
设计1对引物分别扩增加利福尼亚兔和新西兰兔的UCPl基因第5外显子及第4内含子部分序列。PCR扩增(图1)后送往立菲生物技术有限公司进行双向测序,BLAST分析共发现4个SNPs(图2)。NCBI中SNP数据库尚无该基因SNP信息,本试验所筛查的SNPs均为新发现多态性位点,以UCP1基因第1外显子第1位为+1位,SNPs位点分别为G743T、A744G、C819A、G849T,其中G743T为同义突变,A744G为错义突变,导致编码的苏氨酸(Thr)变为丙氨酸(Ala);C819A、G849T突变位点位于内含子区。
2.2估算SNPs等位基因頻率
通过MWSnap软件对加利福尼亚兔和新西兰兔SNPs等位基因峰高进行测量,根据公式估算4个SNPs位点等位基因频率(表1)。由表1可知,内含子C819A和外显子A744G在加利福尼亚兔和新西兰兔中有较大差异,而外显子G743T和内含子G849T在2种兔品种中差异较小,且加利福尼亚兔的4个位点基因频率均高于新西兰兔。
2.3预测UCP1基因的RNA二级结构
预测突变前后UCP1基因的RNA二级结构,结果表明,SNPs导致RNA二级结构发生改变,并导致RNA二级结构最小自由能发生变化,由-1.934 MJ/mol变为-1.932 MJ/mol,这不仅可能影响RNA二级结构的稳定性,还可能影响后续蛋白质翻译过程(图3)。
2.4突变前后UCP1蛋白二级的预测
通过在线SOPMA服务器预测新西兰兔UCP1基因突变前后蛋白质二级结构变化,结果表明:突变前后α螺旋由109变到110,而B转角由39变成40,延伸链由86变到83,自由卷曲由72变到73(表2)。
3讨论
大量的研究表明,UCP基因家族与畜禽肉质关系密切。涂荣剑等对猪的UCP3基因研究發现,突变可能导致相应编码氨基酸序列的改变,从而影响胴体、肉质性状。韩瑞华等对牛的UCP3基因进行研究,发现UCP3基因不仅对肉牛胴体、肉质性状等方面具有重要影响,而且对肉牛的育种工作具有指导作用。王涛等研究了UCP基因对鸡肉质和猪肉质量的影响。肌内脂肪沉积是兔肉肉质标记辅助选择中重要的选择指标,筛选出对家兔肌内脂肪沉积有影响的基因有助于加快品种选育进程和提高家兔肉质性能。
目前对兔的UCP1基因多态性研究报道很少,本试验以加利福尼亚兔和新西兰兔为研究,对UCP1基因第5外显子及第4内含子部分序列进行扩增,将扩增的PCR产物进行双向测序,结果发现4个新的多态性位点:G743T、A744G、C819A、G849T,其中G743T为同义突变,A744G为错义突变,导致编码的苏氨酸(Thr)变为丙氨酸(Ala);C819A、G849T突变位点位于内含子区。比较加利福尼亚兔和新西兰兔多态性位点等位基因频率发现,内含子C819A和外显子A744G在加利福尼亚兔和新西兰兔中有较大差异,而外显子G743T和内含子G849T在2个兔品种中差异较小,且加利福尼亚兔的4个位点基因频率均高于新西兰兔。
12.生物信息学名词解释 篇十二
隐马尔可夫模型( Hidden Markov Models,HMMs) 是含有隐含未知参数的马尔可夫链[1,2]。HMMs由有限个状态组成,每一个状态都以一定的概率出现,状态之间的转换由转换概率表决定,每一个状态均可产生一个观察到的状态,在隐马尔科夫模型中,只有观察到的状态可见,真实的马尔科夫状态链不可见,因此被称为隐马尔科夫模型。
HMMs早期在自然语言处理领域获得了良好的应用[3],比如开始时用于语音识别[4],后来又用于音乐旋律分类[5]。随着HMMs的发展,现今在计算生物学和生物信息学中,也成为了经常被使用的模式识别 ( 或机器学习) 方法[6,7]。很多情况下,生物序列分析就是为每个残基( 或核苷酸) 赋予合适的标签,从而发现生物序列所具有的生物意义[8]。
1HMMs概念
1.1一个例子
如图1所示,5 - 分位点识别问题是从基因发现问题中提炼出来的一个简单举例[1],用以引出对HMM的介绍。假设给定一个DNA序列,其的起始部分是若干个外显子( Exon) ,然后是一个5 - 分位点,最后的部分是若干个内含子( Intron) 。5 - 分位点相当于外显子与内含子的分界限,或者是从外显子转化为内含子的开关。这样,当前的问题就是识别出5 - 分位点的位置。
以上边的信息为基础,可设计一个马尔可夫模型, 如图1的上半部分所示。这个马尔可夫模型包含3个状态,分别对应赋予给碱基的3个标签: 状态E( Exon) ,状态5( 5 - 分位点) 和状态I( Intron) 。每个状态都有转移概率,相应的转移概率从当前状态移动到下一状态。转移概率的大小表示转移到下一状态的可能性的大小,因序列的前半部分都是E状态,中间是5状态, 后半部分都是I状态,所以状态E和状态I到达自身的转移概率要大一些( 0. 9) 。
然而,只依靠马尔可夫模型还不能推测出序列各个碱基对应的标签。想要较好地推测出5 - 分位点的位置,则不同的DNA序列一定具有不同的统计属性。 这里做一些简单的假设: 外显子对应的碱基呈均匀分布( 即A,G,C,T出现的概率均为25% ) ,内含子对应的碱基中有较多的A和T( A和T各占40% ,C和G各占10% ) ,令5 - 分位点对应一个固定的碱基G。
接下来引出HMMs。用上述马尔可夫模型产生一个状态序列。每生成一个状态,用其发射一个碱基。 每种状态发射碱基的概率分布已在上边做了假设,称之为发射概率。然后,用马尔可夫模型的状态转移概率产生下一个状态。由此生成了两个序列信息,一个是状态路径,一个是观测序列( DNA序列) 。在求解的问题中,观测序列是已知的,状态路径( 标签序列) 是未知的( 隐藏起来的) 。这样,在马尔可夫模型的基础上,包含发射概率分布的模型就是一个HMMs。
这样,要设计一个HMMs,就是要确定4方面的信息: ( 1) 符号表( 例如,在DNA序列中符号表中有4个元素AGCT。( 2) 状态集合,M。( 3) 每个状态i的发射概率ei ( x) ,满足概率率每个状态i到达状态j的转移概率ti( j) ,满足概率率。任何具有这些属性的模型就是HMMs。
1.2HMMs的3个计算问题
( 1) 解码问题。在序列分析问题中,给定的DNA序列是观测序列,我们要求解隐藏的状态路径。诸多潜在的状态路径都能产生出相同的观测序列,这样就需要找出具有最高概率的状态路径,这就是HMMs的解码问题。概率P( S,π HMM,θ) 表示了具有参数 θ 的HMM的状态路径S能产生出观测序列 π 的概率, 在求解时要用到 θ 中所有的转移概率和发射概率。例如,在图1中,观测序列有26个碱基,图的中间部分是6个潜在的状态路径,每个状态路径对应27个转移概率和26个发射概率。把这53个概率乘在一起,就得到了P( S,π HMM,θ) 的值。为了便于比较,对每个计算结果进行取对数操作,可发现结果为 - 41. 22的状态路径是最高概率的状态路径,也即5 - 分位点最有可能出现在第5个G的位置。
然而,对于大多数问题,存在诸多潜在的状态路径,文中无法将其一一进行枚举。基于动态规划思想的Viterbi算法[2]可高效地找出概率最高的状态路径。
此外,解码问题还有另外的一个形式—后验解码问题,即找到某个位置处具有最高出现概率的状态,最常用的算 法是后验 解码算法[2],原理是利 用前向 ( Forward) 和后向( Backward) 两个动态规划算法对所有可能的路径进行累加。例如,在图1中,6个潜在的状态路径对应的P( S,π HMM,θ) 值相差较小,若要确定其中哪个最有可能是真实的状态路径。可分别计算6个位置处被标识为状态5的概率,这就是后验解码问题。图1的下侧分别给出了这6个位置被标识为状态5的概率,其中概率值最大的为46% ( 对应于P( S, π HMM,θ) 值等于 - 41. 22的状态路径) ,其明显高于其他位置的概率,因此可以肯定P( S,π HMM,θ) 值等于 - 41. 22的状态路径是最接近于真实情况的状态路径。
( 2) 估值问题。估值问题是计算某个HMMs能生成给定观测序列的可能性。比如图1中的HMMs,用其的转移概率和发射概率分布,来求解生成给定的DNA序列的概率就是估值问题。从另一个角度来看, 给定一个HMMs模型与一个观测序列,估值问题就是衡量这个HMMs对观测序列适用性的好坏。
估值问题常用的算法是前向( Forward) 算法[2]和后向( Backward) 算法[2],其均是精确的算法,一个是从序列的前边开始计算,一个是从序列的后边开始计算。在估值问题中,选取一个算法即可,因为前向和后向算法得到的结果相同。但在后验解码问题中需要同时使用这两个算法,即要计算位置的左边使用前向算法,右边使用后向算法。
( 3) 学习问题。在图1的例子中,所采用的是假设的参数,用估值问题可衡量这些参数对给定序列的适用性,若果适用性较差,需对假设的参数进行更新, 使新的HMMs对给定序列的适用性变强,这个参数更新的过程就是HMMs的学习问题。
解决学习问题,常用的算法是BW算法[2],也称为前向 - 后向算法,是一个广义期望最大化问题。BW算法是EM算法的一个特例,即每次迭代包括一个E步与一个M步。假设有N条观测序列,每条序列的长度为L,且HMM模型有K个状态,则可分析出每次迭代的时间复杂度是O( 3NK2L) 。
2HMMs在生物信息学中的应用
2.1序列比对
序列比对( Alignment) 是为了确定两个或多个序列之间的相似性,而将其按照一定的规律进行排列。为了能将多个序列排列在一起,序列中可插入间隔,一个或多个连续的‘ - ’称为gap。对两个序列进行比对,称为双序列比对,对多个序列进行比对称为多序列比对。本节重点讨论双序列比对,且无特别说明,后文中的序列比对均指双序列比对。
在序列比对问题中引入HMMs的方法如下。首先,序列比对最经典的精确算法是基于动态规划的算法。这个动态规划算法可转化为一个有限自动机。在动态规划算法的每步决策中,实际上是从3种选择中计算出当前的最优解。则整个动态规划算法的多步决策过程,就相当于状态间的不断转移,从而形成了一个拥有3个状态的有限自动机的状态转移链。动态规划算法求解的是状态转移的路径,由此,可将其转化为HMMs的解码问题。有了状态转移路径,通过适当的添加一些间隔,便可完成两个序列的比对。
这样,HMMs的状态集中有3个元素,字符表中有A,G,C,T这4个元素,并初始化一组参数,即状态转移概率和发射概率。区别于基因发现问题,现在状态序列发射的不是一条DNA序列,而是两条DNA序列, 求解序列比对的HMMs如图2所示。
图2中定义了HMMs的3个状态M,X,Y和状态转移概率。M表示比较操作,用于发射两个字符,第一条序列x中的x[i],第二条序列y中的y[j],且发射概率为p( x[i]y[j]) ; X表示插入操作,用于发射一个字符,即第一条序列x中的x[i],第二条序列中添加一个间隔‘- ’,且发射概率为q( x[i]) ; Y表示删除操作, 用于发射一个字符,即第二条序列x中的x[i],第一条序列中添加一个间隔‘- ’,且发射概率为q( y[j]) 。 此外,在实际比对结果中,不应出现如下情况: 第一条序列的位点i处是‘- ’,紧接着在第二条序列的位点i + 1处也是‘ - ’。因此,模型中不允许状态X与状态Y之间进行相互转化。
有了HMM模型后,进行两条序列的比对就是HMM的解码问题,即用Viterbit算法求解出最有可能发射出两条输入序列的状态序列。求解出状态序列后,根据3种状态的发射功能,得出经过序列比对之后的两条序列。假设允许模型中的3个状态间能相互转化,则可对文献[7]中的模型进行修改。图3给出了经修改后的模型,设计思路是要尽量消除序列比对中可能出现的如下情况: 第一条序列的位点i处是‘- ’, 紧接着在第二条序列的位点i + 1处也是‘- ’。
图3中参数设定如下: 从其余状态到只发射一个字符的状态的转移概率记为a,即被标记成绿色的箭头; 只发射一个字符的状态到其自身的转移概率记为c,即被标记成蓝色的箭头; 所有状态到结束状态的转移概率记为e,即被标记成橙色的箭头。然后,在图3的模型中添加状态X与Y之间的转移概率,记为b,即被标记成红色的箭头。在实际中,将b值设置为较小的数,以表示出现一对‘- ’的概率很小,也即两个序列中出现一对‘- ’的罚分将很重。最后,计算其余的状态转移概率。计算原则是: 从某个状态出发,到达其余状态的概率之和为1。例如从X到M的概率为1 b - c - e。
2.2基因发现
基因发现是在一个DNA序列中查找基因,但更通用的一个说法是为DNA进行标签,比如将其标识为coding、intergenic、introns等区域。因此,基因发现常被认为是生物信息学中序列标签问题的一个特例。上文中的例子就是DNA标签的一个简单的抽象,所以不再展开讲解基因发现的HMMs。Krogh等人在基因发现问题中引入了HMMs[9],用以区分E. coli基因中的coding区域和intergenic区域。
随后的用于基因发现的HMMs都是对Krogh等人工作的扩展。例如,Henderson等[10]设计了独 立的HMM模块,使得每个模块适用于一个特定的DNA区域。Kulp和Burge等[11,12]使用一个 特殊的HMM ( GHMM或“hidden semi - Markov model”) ,使得每个内部状态点可发射多次。近年来,研究者更关注于在基因组 范围内进 行基因预 测,并设计相 应的HMMs[13]。
2.3其他的一些应用
多序列比对( Multiple Alignment) 经常用于评估一个新的序列是否属于一个已知的同源序列家庭。多条序列可构成一个谱( Profile) ,即一个位置权重矩阵。 多序列比对往往采用”Profile HMM”技术,HMM的构造原理( 状态转移) 类似于双序列比对的模型。对于多序列比对问题,HMMs是公认的强有力的工具。但HMMs的训练非常耗时,所以通常采用启发式方式进行训练。近年来,模拟退火、粒子群算法等进化算法被用于求解多序列比对的HMMs的训练中[14,15]。
系统发生分析( Phylogenetic Analysis) 。系统发生分析的目标是寻找系统发生的概率模型并得到不同物种的进行树。为解释序列各个位置间进化速度的变化,Felsenstein等将3个可能的速度值做为HMM的状态[16]。Thorne等提出了一个使用HMMs的进化系统发生模型,将主要结构与一个已知或待评测的二级结构合并[17]。最近,Bykova等对HMMs进行了改进,用以解释当显著的特种不确定时的特例[18]。
基因映射( Genetic Mapping) 。使用一个非平稳的HMM进行基因映射,是生物信息学中最早的HMMs应用,即在染色体中已知次序的轨迹间对一些距离进行评估。初始的时候,Lander等基于谱系得到基因间的链接映射[19]。后来,为了得到辐射谱,Slonim等运用了一个基于实验辐射数据的非平稳HMM[20]。随着高通量测序的发展,已有不少的学者关注于基于下一代测序数据的用于基因映射的非平稳HMM[21]。
蛋白质二级结构预测( Secondary Structure Protein Prediction) 。HMMs也应用到了预测一个蛋白质的二级结构,即预测局部三维结构的类型,这是预测全局三维结构非常重要的一步[22]。一个标准的HMM可被看作一个随机的“正则语法”。基于此,Eddy等引入了结合协方差方法的HMMs[23,24]。
信号肽预测( Signal Peptide Prediction) 。信号肽预测就是确定蛋白质在缩氨酸第一区域中的目标地址,通常对于疾病分析和药物研制有重要意义。非常成功的一个方法就是使用一个标准的HMMs在革兰氏阴性的真细菌中预测脂蛋白信号缩氨酸[25]。Schneider等综述了基于HMMs的信号肽预 测的3个其他方法[26]。
横跨膜蛋白质预测( Transmembrane Protein Prediction) 。当前直接测量一个横跨膜蛋白质的3D结构几乎是不可行的。一些研究者专门研究预测螺旋形横跨膜蛋白质拓扑结构的HMMs[27,28]。另外一些研究者则专门研究预测 β - 胡萝卜素横跨膜蛋白质的拓扑结构的HMMs[29,30]。
抗原决定基预测( Epitope Prediction) 。免疫反映中的一个前提步骤是将一个抗原决定基绑定到一个I类或II类MHC微粒。然而,大多数抗原决定基并不能绑定到MHC微粒,所以能预测出哪个抗原决定基能够进行绑定是重要的。Mamitsuka等使用无监督学习来提升HMMs的性能[31],既适用于I类也适用于II类MHC微粒。
3结束语
本文讨论了隐马尔可夫模型( Hidden Markov Models,HMMs ) 在生物信 息学中的 应用情况。 介绍了HMMs,并分析了如何在生 物信息学中设计和 应用HMMs。随着生物实验技术的不断 发展,生物学家 收集的实验数据的种类越来越多、数据量越来越大,而实验分析技术和计算方法明显发生了滞后。因此,虽然当前HMMs已在一些生物信息学领域中得到了良好的应用,但其不乏有更广泛的应用空间,本文旨在为HMMs的初学者提供一个快速的学习途径。
随着生物信息学的快速发展,会不断涌现新的应用。必然需要新的模型结构以适应新的生物信息学问题。鉴于隐马尔科夫强大的适应能力,其可与其他模型相应结合,这些模型如贝叶斯、神经网络、支持向量机、乔姆斯基文法等,在未来的生物信息学应用中继续发挥更大的作用。
摘要:结合DNA序列分析例子,介绍了HMMs与其的解码、估计、学习3个计算问题。综述了HMMs在生物信息学中的应用情况,同时对HMMs在生物信息学中可能的发展方向进行了展望。
【生物信息学名词解释】推荐阅读:
零基础学生物信息学07-31
生物信息学电子资料总汇08-15
生物信息学复习资料10-22
压题信息技术与初中生物教学的整合11-02
信息技术视角下生物教学效益的研究论文10-02
高二生物贾学设计07-19
高二生物上学期学什么07-25
旅游管理信息系统名词解释08-27
市场信息学全08-19