首页 / 文章汇 / 技能干货 / 软件使用

PlasFlow安装及使用教程——高效区分质粒和染色体

  • 看不见的线
  • 1196
  • 2023-12-14 08:48:43
  • 原创

PlasFlow是一种基于基因组特征进行分析的新型工具,基于TensorFlow框架的深度人工神经网络(deep artificial neural network)开发,用以区分质粒和染色体序列。PlasFlow可以从组装的宏基因组中恢复质粒序列,而无需事先了解样品的分类或功能组成,准确度高达96%。它还可以恢复环状和线性质粒的序列,并可以对序列进行初步分类。

IMG_256

PlasFlow的安装

conda安装(推荐使用)

  1. 1、添加bioconda频道安装Biostrings包

conda config --add channels bioconda

conda config --add channels conda-forge

  1. 2、创建名为plasflow的conda环境(避免依赖关系冲突)

conda create --name plasflow python=3.5 -y

由于 TensorFlow要求,需要 Python 3.5

  1. 3、激活创建的环境

conda activate plasflow

  1. 4、安装plasflow和依赖

conda install -c jjhelmus tensorflow=0.10.0rc0 -y

conda install -c smaegol plasflow -y

PlasFlow的使用

1、序列过滤(过滤后的fasta文件可以直接用于PlasFlow预测)

在调用 PlasFlow之前,强烈建议按长度过滤序列,只留下长度超过 1000 bp的序列。PlasFlow与其他基于 kmer的方法类似,在短序列上表现不佳,因为很难从中获得适当的 kmer覆盖。因此,短序列的结果是不可靠的。由于宏基因组组件通常包含大量短重叠群,因此额外的过滤测试可以改善结果并加速 PlasFlow。

filter_sequences_by_length.pl -input input_dataset.fasta -output filtered_output.fasta -thresh sequence_length_threshold

-input 指定输入 fasta文件,其中包含要分类的程序集重叠群

--output 过滤后的 fasta文件

--thresh 序列长度阈值

2、运行

建库结束后就可以开始diamond的运行了,最基本的使用方法:

PlasFlow.py --input Citrobacter_freundii_strain_CAV1321_scaffolds.fasta --output test.plasflow_predictions.tsv --threshold 0.7

-input 指定输入 fasta文件,其中包含要分类的程序集重叠群 [必需]

--output 带有分类表格输出的 TSV文件的名称 [必需]

--threshold 手动指定概率过滤阈值(默认值 = 0.7)

输出结果介绍:

表格文件

contig_id是用于分类的序列的内部 id
contig_name是分类中使用的重叠群名称
contig_length显示分类序列的长度
id是生成的标签(分类)的内部 id
label是实际的分类
...附加列,显示分配给每个可能类别的概率。如果分配给给定类的概率低于阈值(默认值 = 0.7),则该序列被视为未分类。此外,PlasFlow会生成包含输入序列的 fasta文件,这些输入序列已binning到质粒、染色体和未分类中。

此外,PlasFlow还生成 fasta文件,其中包含分箱到质粒、染色体和未分类的输入序列。

参考文献:

Krawczyk PS, Lipinski L, Dziembowski A. Nucleic Acids Res. 2018 Apr 6;46(6):e35. doi: 10.1093/nar/gkx1321.

https://github.com/smaegol/PlasFlow#getting-started

推荐课程

【课程】微生物比较基因组精品系列课——全套自学必入的系统课程

课程链接:微生物比较基因组精品系列课【全套】

【课程】微生物比较基因组与群体进化——基因组变异专题研究

课程链接:微生物比较基因组与群体进化

【课程】微生物分子分型-MLST课程——分型全套(含理论、软件、方法)

课程链接:微生物分子分型-MLST课程

【课程】基因组结构分析神器Easyfig实操精品课

课程链接:基因组结构分析神器Easyfig实操精品课

【课程】BRIG绘图——结构比较专题2

课程链接:走进比较基因组,BRIG软件带你轻松玩绘图

【课程】肺炎克雷伯菌基因组学研究综合指南

课程链接:肺炎克雷伯菌基因组学研究综合指南

【课程】微生物基因组生信必学课程

课程链接:微生物基因组生信分析必学课程

【课程】微生物生防菌研究

课程链接:生防菌的系统化研究

专题材料

【资料】耐药专题材料

【资料】生防专题材料

请添加唯那生物技术客服小唯的微信号winnerbio01,备注“耐药专题”或“生防专题”,立马获取。

更多专题推荐

CORPORATE CULTURE

1、耐药毒力专题

2、EasyFig软件使用指南

3、微生物基因组研究文章

4、微生物分型技术MLST-cgMLST必学要点

  • 点赞 (0人)
  • 收藏 (0人)
看不见的线
  • 课程数:
  • 文章数:
  • 学习人数: 0
关注
--- 作者文章 ---
  • 暂无内容
作者课程
  • 暂无内容
相关好课严选

官方微信公众号

客服热线:15618809518

【勤学如春起之苗,不见其增日有所长。假以时日,你定会为你的努力学习而倍感骄傲,加油!】