首页 / 课程中心 / 语言编程
收藏
加入专辑

【脚本】从gbk文件中提取蛋白质序列以及注释信息

课程价格: ¥19.9
星会员: 9.9
服务承诺:
支付安全保障
可开正规发票
一年内不限次数播放
本套课已累计播放 4 次,有 8 人与你一起进步
  • 课程概述
  • 课程列表
  • 评价(
  • 学习互动
  • 讲师推荐讲课

当我们下载大量的gbk文件时,我们可以从gbk文件中提取蛋白质序列,CDS序列,tRNA以及rRNA序列,以便于下载对这些序列做进一步的分析,如进行找同源单拷贝基因,基于16SrRNA构建进化树等等。

这次分享的脚本是从gbk文件中,提取蛋白质以及蛋白质质对应的注释信息。


脚本运行环境

安装python解释器:安装教程

安装biopython模块


# 使用pip安装
pip install biopython 
# 使用conda安装
conda install -c bioconda biopython

查看脚本参数


 python gbk_extea_protein.py -h 


实战演练


# 只提取蛋白质序列和蛋白质ID
python gbk_extea_protein.py -g AE009952.gbk  -a F -o AE009952.fna
# 提取蛋白质序列以及序列的注释信息
python gbk_extea_protein.py -g AE009952.gbk  -a T -o AE009952.faa


结果展示


注意事项


01脚本需要依赖于Biopython模块,请提前安装,否则脚本无法运行。

02对于基因组较大的真核生物,如人基因组,gbk文件有多个染色体组成,不包含蛋白序列文件,这样的gbk文件无法使用脚本提取蛋白质序列。

03有些gbk文件,作者在上传gbk文件时,没有公开蛋白质序列以及蛋白质注释信息,这样的gbk文件无法使用脚本提取蛋白质序列。

《【脚本】从gbk文件中提取蛋白质序列以及注释信息》课程

心中有疑惑?那就问问学过本课程的其他同学
唯那生物
  • 课程数:
  • 文章数:
  • 学习人数: 1000
关注
——— 讲师简介 ———
——— 联系讲师 ———
作者课程
  • 暂无内容
相关好课严选
  • 暂无内容

官方微信公众号

客服热线:15618809518

【勤学如春起之苗,不见其增日有所长。假以时日,你定会为你的努力学习而倍感骄傲,加油!】