上周小编给大家分享了从gbk文件中提取蛋白质序列以及注释信息。今天小编接着给小伙伴们分享很实用的脚本,当我们下载大量的gbk文件时,我们可以从gbk文件中提取蛋白质序列,CDS序列,tRNA以及rRNA序列,以便于下载对这些序列做进一步的分析,如进行找同源单拷贝基因,基于16S rRNA构建进化树等等。
这次小编分享的脚本是从gbk文件中,提取CDS、rRNA和tRNA序列以及对应的注释信息。
脚本运行环境
安装python解释器:安装教程
安装biopython模块
# 使用pip安装
pip install biopython
# 使用conda安装
conda install -c bioconda biopython
查看脚本参数
python gbk_extea_nucleotide.py -h
实战演练
# 提取CDS序列以及注释信息
python gbk_extea_nucleotide.py -g k12.gbk -t CDS -o k12_cds.fnn
# 提取rRNA序列以及注释信息
python gbk_extea_nucleotide.py -g k12.gbk -t rRNA -o k12_rRNA.fnn
# 提取tRNA序列以及注释信息
python gbk_extea_nucleotide.py -g k12.gbk -t tRNA -o k12_tRNA.fnn
结果展示
脚本说明
01脚本需要依赖于Biopython模块,请提前安装,否则脚本无法运行。
02对于基因组较大的真核生物,如人基因组,gbk文件有多个染色体组成,不包含蛋白序列文件,这样的gbk文件无法使用脚本提取蛋白质序列。
03此脚本只适用于gbk文件中包含有基因组序列信息的核苷酸序列的提取。
>>
上海唯那生物专注于提供微生物包括耐药性研究在内的各类个性化服务,包括基金方案申报、组学测序、个性化生信分析、文章辅导发表、科研绘图、微生物纯化培养、基因克隆、微生物突变体(库)构建等。全方位,一站式,我们期待与您的合作。从数据处理、相关运算,到结果解读、图片绘制,全方位、一站式提供相关研究的解决方案,大家有需要的话也请联系我们。
>>
唯那生物精心准备的微生物耐药专题解析合集材料,具体包括:
1、微生物耐药研究快速入门综述;
2、微生物耐药研究经典案例解读;
3、微生物耐药研究专题方案书;
4、微生物耐药研究的热点好文章。