PlasFlow安装及使用教程——高效区分质粒和染色体
- 看不见的线
- 1196
- 2023-12-14 08:48:43
- 原创
PlasFlow是一种基于基因组特征进行分析的新型工具,基于TensorFlow框架的深度人工神经网络(deep artificial neural network)开发,用以区分质粒和染色体序列。PlasFlow可以从组装的宏基因组中恢复质粒序列,而无需事先了解样品的分类或功能组成,准确度高达96%。它还可以恢复环状和线性质粒的序列,并可以对序列进行初步分类。
PlasFlow的安装
conda安装(推荐使用)
- 1、添加bioconda频道安装Biostrings包
conda config --add channels bioconda
conda config --add channels conda-forge
- 2、创建名为plasflow的conda环境(避免依赖关系冲突)
conda create --name plasflow python=3.5 -y
由于 TensorFlow要求,需要 Python 3.5
- 3、激活创建的环境
conda activate plasflow
- 4、安装plasflow和依赖
conda install -c jjhelmus tensorflow=0.10.0rc0 -y
conda install -c smaegol plasflow -y
PlasFlow的使用
1、序列过滤(过滤后的fasta文件可以直接用于PlasFlow预测)
在调用 PlasFlow之前,强烈建议按长度过滤序列,只留下长度超过 1000 bp的序列。PlasFlow与其他基于 kmer的方法类似,在短序列上表现不佳,因为很难从中获得适当的 kmer覆盖。因此,短序列的结果是不可靠的。由于宏基因组组件通常包含大量短重叠群,因此额外的过滤测试可以改善结果并加速 PlasFlow。
filter_sequences_by_length.pl -input input_dataset.fasta -output filtered_output.fasta -thresh sequence_length_threshold
-input 指定输入 fasta文件,其中包含要分类的程序集重叠群
--output 过滤后的 fasta文件
--thresh 序列长度阈值
2、运行
建库结束后就可以开始diamond的运行了,最基本的使用方法:
PlasFlow.py --input Citrobacter_freundii_strain_CAV1321_scaffolds.fasta --output test.plasflow_predictions.tsv --threshold 0.7
-input 指定输入 fasta文件,其中包含要分类的程序集重叠群 [必需]
--output 带有分类表格输出的 TSV文件的名称 [必需]
--threshold 手动指定概率过滤阈值(默认值 = 0.7)
输出结果介绍:
表格文件
contig_id | 是用于分类的序列的内部 id |
contig_name | 是分类中使用的重叠群名称 |
contig_length | 显示分类序列的长度 |
id | 是生成的标签(分类)的内部 id |
label | 是实际的分类 |
... | 附加列,显示分配给每个可能类别的概率。如果分配给给定类的概率低于阈值(默认值 = 0.7),则该序列被视为未分类。此外,PlasFlow会生成包含输入序列的 fasta文件,这些输入序列已binning到质粒、染色体和未分类中。 |
此外,PlasFlow还生成 fasta文件,其中包含分箱到质粒、染色体和未分类的输入序列。
参考文献:
Krawczyk PS, Lipinski L, Dziembowski A. Nucleic Acids Res. 2018 Apr 6;46(6):e35. doi: 10.1093/nar/gkx1321.
https://github.com/smaegol/PlasFlow#getting-started
推荐课程
【课程】微生物比较基因组精品系列课——全套自学必入的系统课程
课程链接:微生物比较基因组精品系列课【全套】
【课程】微生物比较基因组与群体进化——基因组变异专题研究
课程链接:微生物比较基因组与群体进化
【课程】微生物分子分型-MLST课程——分型全套(含理论、软件、方法)
课程链接:微生物分子分型-MLST课程
【课程】基因组结构分析神器Easyfig实操精品课
【课程】BRIG绘图——结构比较专题2
【课程】肺炎克雷伯菌基因组学研究综合指南
课程链接:肺炎克雷伯菌基因组学研究综合指南
【课程】微生物基因组生信必学课程
课程链接:微生物基因组生信分析必学课程
【课程】微生物生防菌研究
课程链接:生防菌的系统化研究
专题材料
【资料】耐药专题材料
【资料】生防专题材料
请添加唯那生物技术客服小唯的微信号winnerbio01,备注“耐药专题”或“生防专题”,立马获取。
更多专题推荐
CORPORATE CULTURE
1、耐药毒力专题
-
点赞 (0人)
- 收藏 (0人)