首页 / 课程中心 / 语言编程
收藏
加入专辑
0

【脚本】批量下载fasta文件和gbk文件

课程价格: ¥19.9
折扣价: ¥9.9
星会员: 1
服务承诺:
支付安全保障
可开正规发票
一年内不限次数播放
本套课已累计播放 8 次,有 13 人与你一起进步
  • 课程概述
  • 课程列表
  • 评价(
  • 学习互动
  • 讲师推荐讲课

GenBank数据库是在科研工作中经常用到的数据库之一,它由美国国家生物技术信息中心(the National Center for Biotechnology Information,NCBI)建立和维护。该数据库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。

小编作为一名有着多年工作经验生信工作者,经常要从GenBank数据库中中下载物种的基因组fasta文件和gbk文件。在小编刚刚入门生信这行时和大多数小伙伴一样使用浏览器一条一条的进行下载,这样的下载方法,对于少量的序列还可以执行,但是如果下载成千上百条序列就成了“灾难”!

最近,小编在学习Biopython模块,发现这个模块下面有子模块可以批量下载GenBank数据库中的fasta文件和gbk文件,小编已经打包成一键化脚本,下面跟小编一起学习一下吧!


脚本运行环境

安装python解释器:安装教程

安装biopython模块


# 使用pip安装
pip install biopython 
# 使用conda安装
conda install -c bioconda biopython


准备list文件

查看脚本参数

python GenBank_download.py -h 

实战演练


# 下载序列fasta文件
python GenBank_download.py -f fasta -a down_list.txt
# 下载序列gbk文件
python GenBank_download.py -f gb -a down_list.txt 


结果展示


注意事项

1、脚本需要依赖于Biopython模块,请提前安装,否则脚本无法运行。

2、脚本只能下载序列的fasta文件和gbk文件,如原核生物基因组fasta文件,无法下载gbk文件中的蛋白序列和CDS序列。

3、对于基因组较大的真核生物,如人基因组,gbk文件有多个染色体组成,不包含基因组fasta文件,这样的序列号无法下载基因组fasta文件。

4、脚本下载序列的gbk文件和fasta文件等同于浏览器下载的gbk文件和fasta文件。

>>

上海唯那生物专注于提供微生物包括耐药性研究在内的各类个性化服务,包括基金方案申报、组学测序、个性化生信分析、文章辅导发表、科研绘图、微生物纯化培养、基因克隆、微生物突变体(库)构建等。全方位,一站式,我们期待与您的合作。从数据处理、相关运算,到结果解读、图片绘制,全方位、一站式提供相关研究的解决方案,大家有需要的话也请联系我们。

【上海唯那生物科技有限公司公司简介】点击跳转

>>

唯那生物精心准备的微生物耐药专题解析合集材料,具体包括:
1、微生物耐药研究快速入门综述;
2、微生物耐药研究经典案例解读;
3、微生物耐药研究专题方案书;
4、微生物耐药研究的热点好文章。

《【脚本】批量下载fasta文件和gbk文件》课程

心中有疑惑?那就问问学过本课程的其他同学
唯那生物
  • 课程数:
  • 文章数:
  • 学习人数: 798
关注
——— 讲师简介 ———
——— 联系讲师 ———
作者课程
  • 暂无内容
相关好课严选
  • 暂无内容

官方微信公众号

客服热线:15618809518

【勤学如春起之苗,不见其增日有所长。假以时日,你定会为你的努力学习而倍感骄傲,加油!】