常用的物种分类鉴定基因或序列

LSU rDNA,large subunit rDNA,核糖体大亚基脱氧核糖核酸。LSU rDNA序列能转录出LSU rRNA(核糖体大亚基核糖核酸)。LSU rRNA和SSU rRNA是核糖体的主要组成成分。LSU rDNA序列长度:真核生物在Rfam数据库编号为RF02543,长度3401 bp;细菌在Rfam数据库编号RF02541,长度2925 bp;古菌在Rfam数据库编号RF02540,长度2990 bp。使用Infernal软件将DNA序列和Rfam数据库中的LSU rRNA家族cm模型进行比较进行鉴定。

SSU rDNA,small subunit rDNA,核糖体小亚基脱氧核糖核酸。SSU rDNA序列能转录出SSU rRNA(核糖体小亚基核糖核酸)。LSU rRNA和SSU rRNA是核糖体的主要组成成分。SSU rDNA序列长度:真核生物在Rfam数据库编号为RF01960,长度1851 bp;细菌在Rfam数据库编号RF00177,长度1533 bp;古菌在Rfam数据库编号RF01959,长度1477 bp。使用Infernal软件将DNA序列和Rfam数据库中的LSU rRNA家族cm模型进行比较进行鉴定。yi

ITS region,internal transcribed spacer region,内转录间隔区。rDNA序列能转录出的前体RNA(pre-RNA,precursor RNA)包含LSU rRNA和SSU rRNA,以及两者之间的5s或5.8s rRNA。在该前体RNA序列上不同rRNAs的内部并将rRNAs隔离开的转录区域,即为内转录间隔区。它一般包含两个区域ITS1和ITS2。前者指SSU往5s或5.8s之间的区域,后者指5s或5.8s往LSU之间的区域。SSU和LSU rDNA序列位于基因组上,中间隔着5s或5.8s rDNA序列。它们一起作为一个重复单元,在基因组上串联重复许多次。若转录起始位点位于以上重复单元上游某区域,则相应的外转录间隔区则是LSU和SSU之间的一段序列,位于前体RNA两端不属于rRNA的序列;若转录的对象不是一个重复单元,而是整个重复序列全部,则LSU和SSU之间的序列也应该是内转录组间隔区,或者称为ITS3区域。在真和生物中,SSU 的沉降系数是18s,LSU是28s;在原核生物中SSU是16s,LSU是26s。在原核生物中仅存在5s rRNA;在真核生物基因组中一般同时有5s和5.8s rRNA。在真核生物中,rDNA重复单元中一般仅有5.8s,但有些物种也包含5s。由于LSU和SSU rDNA序列非常保守,可能无法用于物种的区分。此时,采用进化速度约高10倍的ITS序列进行鉴定是更加有效的。若需要检测基因组上的ITS序列,则需要先使用Infernal软件基于Rfam数据鉴定出LSU、SSU、5s和5.8s rDNA序列后,在分析ITS1和ITS2序列。

RPB2,RNA polymerase beta(II) subunit 2,RNA聚合酶II第二亚基。RNA聚合酶II用于DNA介导下合成mRNA,在遗传信息的转录中发挥重要作用。它由12个亚基构成,其中最大的亚基是RPB1,第二大的亚基是RPB2。RPB1基因通常在大部分物种中是多拷贝的,而RPB2基因则是单拷贝的。故RPB2基因比RPB1更适合于物种的分类和鉴定。该蛋白序列比较大,有约1200 aa,可使用Pfam数据库进行鉴定,要求其蛋白序列同时具有7个结构域(PF04563、PF04561、PF04565、PF04566、PF04567、PF00562、PF04560),才能鉴定其为RPB2蛋白。因为RNA聚合酶I、II和III第二大亚基的蛋白序列是非常相似的,整个基因组中可能有2~3个基因的蛋白序列都能鉴定到这7个结构域,此时选择其中最优的基因(对7个结构域的覆盖率高达98~100%)作为RPB2基因。

TUBB,tubulin beta chain,β-tubulin。β-tubulin是微管蛋白三种亚基之一,细胞骨架中的重要组成成分。细胞骨架是细胞内的一种支持结构,它包括微管、微丝和中间丝等结构,起到维持细胞形态、细胞运动以及细胞内物质运输的重要作用。微管蛋白是由α-、β-微管蛋白分子聚合而成的异二聚体,α-和β-两种亚基分别与GTP和GDP结合。β-微管蛋白是微管的动态单位,其组装后即在 β-微管蛋白处发生 GTP 水解。将蛋白序列和Swiss-Prot数据库进行比对,其结果应该是“Tubulin beta chain”。不推荐使用Pfam数据库对β-tubulin蛋白进行鉴定,因为alpha、beta和gamma三种类型的tubulin chains都具有PF00091(Tubulin/FtsZ family, GTPase domain)和PF03953(Tubulin C-terminal domain)结构域。β-tubulin基因一般是多拷贝基因。

EF-Tu,EF-1A,EF-1alpha,elongation factor Tu,延伸因子Tu。EF-Tu在蛋白质合成过程中的作用是确保正确的氨酰-tRNA选择,并促进蛋白质链的延长。它能够与氨酰-tRNA形成一个稳定的复合物,将其带到核糖体A位上,使氨酰-tRNA与mRNA上的密码子完全配对。然后,核糖体通过水解三磷酸腺苷(GTP)来释放EF-Tu,并继续蛋白质的合成。EF-Tu包含3个结构域PF00009(Elongation factor Tu GTP binding domain)、PF03144(Elongation factor Tu domain 2) 和PF03143(Elongation factor Tu C-terminal domain)。可使用Pfam数据库进行分析,要求其蛋白序列同时具有以上3个结构域,则鉴定为EF-Tu基因。EF-Tu基因一般是多拷贝的。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据