基因序列是什么?
生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发, 分析序列中表达结构和功能的生物信息 。生物信息学的基本任务是对各种生物分析序列进行分析, 也就是研究新的计算机方法, 从大量的序列信息中获取基因结构、功能和进化等知识。而在序列分析中, 将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定, 拼接, 基因的表达分析, 到RNA和蛋白质的结构功能预测。物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义。基因组中由寡核苷酸串联,重复排列的DNA序列,构成数量可变的串联重复序列,其中,微卫星DNA又称为短串联重复片列,是一种可遗传的不稳定的且具有高度多态性的短核苷酸重复序列,具有种类多,分布广,高度多态性等特点,这种多态性标志已广泛用于遗传病及亲子鉴定等.短序列比对中,一般常用的算法主要有三个:(1) 空位种子片段索引法,首先将读段切分,并选取其中一段或几段作为种子建立搜索索引,再通过查找索引、延展匹配来实现读段定位,通过轮换种子考虑允许出现错配)的各种可能的位置组合;无论在发育期还是在成人体内,既有大量的新细胞产生,也有大量的旧细胞死亡,这是生物体的一种自然现象。为了维持机体组织中适宜的细胞数量,在细胞分裂和细胞死亡之间需要一种精确的动态平衡。由于这种生成与死亡的有序流程,在胚胎和成人期便维持着人体组织的适宜细胞数量。而这种精密地控制细胞的消亡过程就称为程序性细胞死亡。正常的生命需要细胞分裂以产生新细胞,并且也要有细胞的死亡,由此人体和生物的器官才得以维持平衡。
基因序列是什么
基因序列就是使用一串字母表示的真实的或者假设的携带基因信息的DNA分子的一级结构。基因序列中的字母只有四种,即A、C、G、T,分别代表组成DNA的四种核苷酸——腺嘌呤,胞嘧啶,鸟嘌呤,胸腺嘧啶,任意长度大于4的一串核苷酸被称做一个序列,每个字母代表一种碱基,两个碱基形成一个碱基对,碱基对的配对规律是固定的,即A-T,C-G。
基因的蛋白质编码序列是什么序列?
基因的蛋白质编码序列是CDS序列,可以叫coding segment或coding sequence。这条序列从ATG启动密码子开始,终止密码子结束。所有的CDS都是ORF(开发阅读框 open reading framework),ORF就是ATG开始,终止密码子结束的一条序列,但ORF不一定编码蛋白,这是它和CDS的区别,只有编码蛋白的ORF才是CDS。对于真核生物来说,mRNA是由外显子组成的。真核生物在转录后产生核不均一RNA(hnRNA)经过修饰加工可变剪切(除去内含子)形成成熟mRNA。原核生物则不需要。所以在生物信息学中单纯使用查找ATG的方式找ORF只适合原核生物或mRNA,真核有专门的基因预测软件。基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。
怎么找基因序列?
据基因的构成原理寻找基因序列,如下:A、C、G和T分别代表组成DNA的四种核苷酸——腺嘌呤,胞嘧啶,鸟嘌呤,胸腺嘧啶。每个字母代表一种碱基,两个碱基形成一个碱基对,碱基对的配对规律是固定的,即是:A-T,C-G。典型的他们无间隔的排列在一起,例如序列AAAGTCTGAC。任意长度大于4的一串核苷酸被称作一个序列。关于它的生物功能,则依赖于上下文的序列,一个序列可能被正读,反读;包含编码或者无编码。DNA序列也可能包含“junk DNA”。注:带有遗传讯息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。组成简单生命最少要265到350个基因。扩展资料:基因诊断当环境中的有害物质进入受精卵或母体,当父母有一定的共同血缘或有一定相同数目的遗传基因关系,在这些情况下,后代的基因组里的基因会发生缺陷,产生疾病。通过使用基因芯片等技术分析人类基因组,可找出致病的遗传缺陷基因区域。癌症、糖尿病等,都是遗传基因缺陷引起的疾病。医学和生物学研究人员将能在数秒钟内鉴定出最终会导致癌症等的突变基因。借助一小滴测试液,医生们能预测药物对病人的功效,可诊断出药物在治疗过程中的不良反应,还能当场鉴别出病人受到了何种细菌、病毒或其他微生物的感染。利用基因芯片分析遗传基因,将使10年后对糖尿病的确诊率达到50%以上。未来人们在体检时,由搭载基因芯片的诊断机器人对受检者取血,转瞬间体检结果便可以显示在计算机屏幕上。利用基因诊断,医疗将从千篇一律的“大众医疗”的时代,进一步精确到依据个人遗传基因而异的“定制医疗”的时代,也可以抽羊水进行产前基因诊断。参考资料来源:百度百科-DNA序列
列举一个已知的 DNA序列编码一种以上蛋白质的三种方法。
出现在重叠基因中:
①在核糖体结合位点之后含有多重起始位点,或终止密码的漏读(其中UGA、UAG易被漏读、错读,UAA能严格终止),例如两种蛋白质均从同一起始密码开始起译,其中一种蛋白在遇到第一个终止密码是就停止翻译,另一种蛋白由于发生漏读,核糖体继续翻译到下一个终止密码处;
②以不同的读码框架对同一条mRNA进行识读和翻译;
③选择不同的起始密码AUG,但按同一个读码框架对同一条mRNA进行识读和翻译;
④编码在同一DNA区段不同极性单链上的重叠基因,即反向重叠基因;
⑤真核生物内含子选择性剪接可由同一初级转录物产生多种蛋白质,即同源异型蛋白。
另一个版本:
①在核糖体结合位点之后含有多重起始位点
②在一两个碱基的移码方式出现重叠的可读框
③不同的剪接方式,产生不同的mRNA方式