SRA Toolkit安装及使用教程——高通量测序数据下载处理的软件包
- 看不见的线
- 1664
- 2023-12-01 09:02:14
- 原创
您是否对基因组学研究充满了好奇和渴望?想要深入了解生物的遗传信息,揭示其中隐藏的奥秘?那么,SRA Toolkit将成为您最强大的助手。作为一款功能强大且易于使用的工具集,SRA Toolkit将为您提供快速、高效地获取和分析原始测序数据的解决方案。
Sratools是NCBI官方提供,用于操作SRA (reads and reference alignments)数据的工具集合,一般常用于:
- 下载SRA文件,
- 从SRA文件中提取fastq文件。
SRA Toolkit的安装
- conda 安装(推荐使用)
conda install sra-tools -y
- 传统安装
2.1在Linux系统(以CentOS为例)下将上述的链接下载到本地
wget --output-document sratoolkit.tar.gz https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz
2.2解压安装包
tar -vxzf sratoolkit.tar.gz
2.3将sratoolkit路径添加到环境变量
export PATH=$PATH:$PWD/sratoolkit.3.0.0-mac64/bin
2.4 验证 shell是否能找到二进制文件
which fastq-dump
2.5测试工具包是否正常运行(若输出以下内容则表明安装成功)
fastq-dump --stdout -X 2 SRR390728
SRA Toolkit的使用
官方文档:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc
- 1、下载SRA
下载单个文件:
prefetch SRR390728
下载多个文件:
#创建一个accession文件,用于保存序列号
prefetch --option-file srr.txt
- 2、抽取fastq文件(在下载到的sra文件所在目录下)
2.1 fastq-dump使用
#查看帮助文档
fastq-dump -h
#抽提fq文件,并将其压缩
fastq-dump --gzip -O $PWD --split-3 *.sra
# --gzip:输出gz格式压缩文件,节省空间,稍微多费点时间
# -O ${directory}:设置输出的文件间路径,outdirectory改为相应路径
# --split-3:不知道sra是单端还是双端,默认使用--split-3
2.2 fasterq-dump使用
#多线程抽提fq文件
fasterq-dump -p -e 24 --split-3 -O ${outdirectory} SRR1234567.sra
#-p可以显示进程
#-e 24使用24个线程
# fasterq-dump不能使用压缩命令。
参考文献:
https://github.com/ncbi/sra-tools/wiki
推荐课程
【课程】微生物比较基因组精品系列课——全套自学必入的系统课程
课程链接:微生物比较基因组精品系列课【全套】
【课程】微生物比较基因组与群体进化——基因组变异专题研究
课程链接:微生物比较基因组与群体进化
【课程】微生物分子分型-MLST课程——分型全套(含理论、软件、方法)
课程链接:微生物分子分型-MLST课程
【课程】基因组结构分析神器Easyfig实操精品课
【课程】BRIG绘图——结构比较专题2
【课程】肺炎克雷伯菌基因组学研究综合指南
课程链接:肺炎克雷伯菌基因组学研究综合指南
【课程】微生物基因组生信必学课程
课程链接:微生物基因组生信分析必学课程
【课程】微生物生防菌研究
课程链接:生防菌的系统化研究
专题材料
【资料】耐药专题材料
【资料】生防专题材料
请添加唯那生物技术客服小唯的微信号winnerbio01,备注“耐药专题”或“生防专题”,立马获取。
更多专题推荐
CORPORATE CULTURE
1、耐药毒力专题
-
点赞 (0人)
- 收藏 (0人)