本文讲述如何对基因组预测基因进行COG分类。
一 COG简介
COG,即Clusters of Orthologous Groups of proteins。
其网址主页为: http://www.ncbi.nlm.nih.gov/COG/。
网页版使用工具网址: http://www.ncbi.nlm.nih.gov/COG/old/xognitor.html。
使用说明文档网址: http://www.nlm.nih.gov/COG/old/COGhelp.html。
其FTP站点为: ftp://ftp.ncbi.nih.gov/pub/COG/。
通过观看其主页和说明文档,可以理解为COG是NCBI的数据库。COG的中文释义即“同源蛋白簇”。COG分为两类,一类是原核生物的,另一类是真核生物。原核生物的一般称为COG数据库;真核生物的一般称为KOG数据库。
COG注释作用:1. 通过已知蛋白对未知序列进行功能注释; 2. 通过查看指定的COG编号对应的protein数目,存在及缺失,从而能推导特定的代谢途径是否存在; 3. 每个COG编号是一类蛋白,将query序列和比对上的COG编号的proteins进行多序列比对,能确定保守位点,分析其进化关系。
二 将序列进行COG分类的步骤
1. COG的ftp里边提供了一个名为myva的文件,该文件里面为COG数据库的蛋白质序列,有192987条。将该序列文件使用使用ncbi-blast-2.2.26+中的blastdb程序制作出一个前缀为cog的蛋白质数据库。
2. 将需要进行COG注释并分类的DNA序列或protein序列分别使用blastx或blastp比对到上一步骤建好的cog数据库中。得出xml的比对结果。
3. 根据上一步骤的比对结果,得出与query序列相似的cog蛋白id。在COG的ftp里面有一个名为whog的文件,该文件中记录着COG数据中绝大部分的蛋白质id以及其所对应的以COG开头的protein编号,同时也记录这COG编号对应的功能分类编号。因此,可以得出query序列注释的COG编号以及其功能分类编号。
4. ftp中还有一个名为fun.txt的文件,该文件记录这COG的功能分类编号,及其对编号的功能描述。
5. 因此,我编写了一个脚本程序用于COG分类注释。该脚本程序名字为cog.pl。输入为所需要进行COG分类的fasta序列文件,得出序列的比对结果和分类统计。
三 将序列进行KOG分类
方法和COG的分类一致。值得注意的是KOG数据中protein的编号是以LSE或TWOG开头的。同样,我编写了一个kog.pl。
四 说明补充
值得说明的是,KOG数据库中蛋白质序列数目为112920条,但是其中有protein编号的只有27887条,占25%。而COG数据库中蛋白质序列条数为192987,其中有COG编号的有129326条,占67%。所以比对结果中,很多序列比对上了KOG数据库,但是没有protein编号;而在比对到COG数据库时会好很多。
所以,可以先将序列比对到COG数据库,得出分类数据;然后将没有分类编号的序列挑选出来,再比对到KOG数据库,得出分类数据;然后将两个分类数据进行整合,然后画出COG分类图。
觉得很棒,很赞。能否共享下你的脚本到我的邮箱哦?
你的邮箱呢?你确定你确实需要的话,我会发给你脚本。但是不负责售后。很可能程序在你机器上就运行不好的。
能否也发一份你编的程序啊!我非常需要,谢谢!
给我发邮件索要即可
你好,能发一份给我么,最近正在做这方面工作,谢谢了,dx8715@163.com
能不能给我发一下脚本,万分感谢
能不能给我发一份脚本,邮箱zxg19930103@yeah.net,谢谢
也发一份给我,拜托!
给我发邮件索要即可
陈老师,能不能也给我发一份脚本?谢谢,872664567@qq.com
这个脚本,你还有吗?能给我传一个吗?
麻烦帮我也发一份谢谢
给我发邮件索要即可
额,之前买的书,上面的给的链接不能用了!
您好,我想知道,如果真核生物的基因功能分类,结合cog数据做,这样做出的功能分类可信吗?
真核生物使用kog来做,才可信些。其实cog和kog在2003年就没更新了。做这个东西可能没多大意义了。
麻烦也给我发一份,谢谢:)
给我发一份你得脚本吧!谢谢!
给我发一份你得脚本吧! 非常谢谢!
非常好的软件
能否发给我一份
非常需要这个脚本,希望楼主分享一下!非常感谢!!!
非常需要这个脚本,请楼主分享一下!
cog.pl和kog.pl的脚本还有吗?谢谢博主编的书,非常好,只是缺脚本哈,尤其对我们这些不太懂编程的人来说
您好,陈老师,在NGS生物信息分析书中,您的教材中的链接打不开,能不能发份脚本到我邮箱呢?打扰您了。
向您要一下脚本,谢谢!
也请发给我一份脚本吧fenghen360@126.com
谢谢陈博
老师能否也发一份COG和KOG的脚本给我呢?谢谢!
我的邮箱yechao1234567890@126.com
陈老师,我正在做基因组注释,能否发一个cog.pl脚本,十分感谢!!!
邮箱:tsjhzau@qq.com
陈老师,看了您的博客,写的很好,我最近也在做相关的注释,能否把脚本给我发一份呢?谢谢!我的邮箱cshen226@126.com,十分感谢!!
老师,最近在做相关的实验,能否麻烦您发一份 cog.pl 的脚本到我邮箱呢?谢谢。13142214681@163.com
陈老师,您好!看了您的博客,写得很好!我在做细菌的基因组注释,能否麻烦您发一个cog.pl脚本?跪谢!!!
邮箱:mengpeiqi_9343@126.com
能发个脚本?
老师,您好!谢谢您分享的这么宝贵的经验,我在做细菌的基因组注释,正在发愁如何做COG 分析,看了您的分享,如获至宝,能否麻烦您发一个cog.pl脚本?非常感谢!
邮箱:xueting221314@126.com
老师,您好!谢谢您分享,能否麻烦您发一个cog.pl和kog.pl脚本?非常感谢!
邮箱:05wenjie@163.com
陈老师,您好!看了您的博客,很有感触!我在做细菌的基因组注释,能否麻烦您发一个cog.pl脚本?跪谢!!!
老师,您好!谢谢您分享,能否麻烦您发一个cog.pl和kog.pl脚本?非常感谢! 邮箱:277877692@qq.com
老师,您好!能否麻烦您发一个cog.pl和kog.pl脚本?非常感谢! 我的邮箱是:10567487@qq.com
老师,您好!能否麻烦您发一个cog.pl和kog.pl脚本?非常感谢! 我的邮箱是xiangvswei418529@sina.com 谢谢!
陈老师,您好!能否麻烦您发cog.pl和kog.pl给我,非常感谢! 我的邮箱是longzhu2011@126.com 谢谢!
觉得很棒,很赞。能否共享下您的cog_from_xml.pl cog_R.pl脚本到我的邮箱哦?liu207702@163.com
陈老师您好,COG数据库现在有一个更新版的COG2014,不知道您是否知道怎么使用它进行基因注释,能否分享一下?
老师,您好!能否麻烦您发一个cog.pl和kog.pl脚本?非常感谢!
老师,您好!能否麻烦您发一个cog.pl和kog.pl脚本?非常感谢! 邮箱是micheal_your@sina.com
可以给我一份脚本吗 万分感谢
能给我发一份脚本吗 还有R程序谢谢我的邮箱是3308396332@qq.com
樊博士您好,能否麻烦您发一个cog.pl和kog.pl脚本?非常感谢! 邮箱是1490025927@qq.com。
老师您好,看了您的博客,写的很好,我最近也在做相关的注释,能否把脚本给我发一份呢?谢谢!我的邮箱1391074572@qq.com,十分感谢!!
程序也发我一份吧,谢谢啦
能发一份给我吗,liwuhui11@163.com
陈老师,您好!我在做细菌的基因组注释,能否麻烦您发一个cog脚本?谢谢!
邮箱:zhaoqiang.1985@aliyun.com
陈老师,您好!我在做混合体系的宏基因组注释,能否麻烦发下COG和KOG脚本?谢谢!
邮箱:812016105@qq.com
陈老师,您好!正在做有关基因注释方面的,遇到一些问题,能否请您发一份COG脚本,非常感谢!
陈老师,能否分享一下您的kog.pl 脚本,目前正在做这块,急需。我的邮箱:1010357043@qq.com
谢谢
老师您好,最近在学习COG注释,能否共享下您的cog_from_xml.pl cog_R.pl脚本到我的邮箱378713742@qq.com? 谢谢!
能给我一份和怎么使用吗?谢谢,我的邮箱是3308396332@qq.com
老师,您好,不知道能不能共享下您的cog_from_xml.pl cog_R.pl脚本到我的邮箱616501831@qq.com,最近正在学习这方面的知识,谢谢。
老师您好,最近在学习COG注释,能否共享下您的cog_from_xml.pl cog_R.pl脚本到我的邮箱1466554686@qq.com? 谢谢!
您好,我最近也在做COG注释,cog_from_xml.pl cog_R.pl这连个鬼脚本能否发一下给我?非常感谢您!
我的邮箱:Gyn667300228@163.com
不好意思,写错字了,cog_from_xml.pl cog_R.pl这两个脚本能否发我一下,Gyn667300228@163.com。谢谢您!
您好,老师。可否方便共享一下这两个脚本。。cog_from_xml.pl cog_R.pl。谢谢。
老师,您好。可否共享一下您的这两个脚本。cog_from_xml.pl cog_R.pl。谢谢
tiankr544@tju.edu.cn
推荐淘宝搜索《NGS生物信息分析》,我写的教材,对COG注释部分在教材中更好,同时附带有U盘,包含有脚本程序。
陈老师,您好。我最近在做COG注释分析,请问能否提供一下cog_from_xml.pl 和cog_R.pl两个脚本。非常感谢!liwenjia@sibs.ac.cn
陈老师,您好。我在做COG注释分析,请问能否提供一下cog_from_xml.pl 和cog_R.pl两个脚本。非常感谢!我的邮箱是1002826767@qq.com
陈博您好,最近在学习COG注释,能否共享下您的cog_from_xml.pl和cog_R.pl脚本到我的邮箱 liyingying17@mails.ucas.ac.cn?万分谢谢!
回复 ↓
陈老师,能否将两个脚本发给我,邮箱673989560@qq.com
陈老师您好,我最近在做COG注释分析,能否分享一下您的脚本?邮箱:hxx882@sina.com
老师您好,我刚开始接触到COG,能不能给我分享一下您的脚本,谢谢。我的邮箱为:15738814386@163.com
您好!
请教个问题,对于肠道宏基因组,能否把COG和KOG的数据库合并一起,然后一起比对注释呢?
可以的,但是cog和kog可能用于功能分类,若合并后,其大类的分类法可能没法做了。
博主 最近在学习cog注释 很想要你的cog和kog分类的脚本能否分享到我的邮箱呢?万分感谢! 724303223@qq.com
老师您好,求一份cog和kog的脚本,万分感谢 1040355696@qq.com
老师您好,请问是否可以分享一下您进行COG注释分类的脚本呢?非常感谢!diamonds123@sina.com
你好,博主,我最近在做cog注释,blast输出文件是out 6格式,xlsx格式,可以不可以用您的脚本,可以发我一份cog和kog分类到我邮箱吗,非常感谢!1620298555@qq.com
老师您好,请问是否可以分享一下您进行COG注释分类的脚本呢?非常感谢!muhongxin123@163.com
可否分享脚本,谢谢!770877855@qq.com
博主,还在更新吗。请问下转录组做完比对后,进行组装。组装出来的转录本或者基因我可以用来做注释,有哪些库可以做注释呢
COG分类比较简单,没什么更新。这篇博文一直没更新的,在我的教材和数据U盘(主页上有淘宝连接购买的哦)中有更详细的操作和脚本程序。
老师您好,请问是否可以分享一下您进行COG注释分类的脚本呢?非常感谢!874388849@163.com
老师您好,最近在做COG基因功能分类分析,希望可以分享您写的脚本,万分感谢.
可以考虑购买我的教材或参加培训班,获取最新的脚本程序。
陈老师,您好,能否发给我一下做COG分析的脚本呢?非常感谢!email:
df_xie2017@163.com
可以考虑购买我最新版本的教材和U盘资料。其中包含脚本文件,可以分析COG。
老师:您好,我最近在做COG基因功能分类分析,能否发给我一下您做COG分析的脚本呢?非常感谢.email:yulo_zh@163.com
陈老师,您好,能否发给我一下做COG分析的脚本呢?非常感谢!email:
1414338588@qq.com