首页 / 文章汇 / 技能干货 / 软件使用

RPS-BLAST使用

  • 看不见的线
  • 29
  • 2025-07-16 08:30:28
  • 原创

RPS-BLAST类似于 HMMER,可用于在CDD数据库里搜索某蛋白是否含有一domain或者是否属于某一family寻找蛋白序列具有的保守Domain。

蛋白序列的Domain对于蛋白质来说是最重要的一部分,一般来说会有发挥功能的区域,结合其它物质的区域,二聚化区域等等。

RPS-Blast安装和使用:

# 数据下载,这个文件是包含了NCBI网页版的各个库的,即CDD、COG、SMART、TIGR、PRK等。

wget https://ftp.ncbi.nih.gov/pub/mmdb/cdd/cdd.tar.gz

# 解压

tar -xzvf cdd.tar.gz

# 格式化数据库
makeprofiledb -title Pfam.v.xxx -in Pfam.pn -out Pfam -threshold 9.82 -scale 100.0 -dbtype rps -index true

# -title是给输入的文件的命名(可有可无)

# -in是输入文件,即需要被制作数据库的文件,pn文件中存放的是smp文件名

# -out为输出文件,即数据库的名字,后续使用此名字进行rpsblast

# -threshold向查找表中添加词条的最小分数,默认值为 9.82(Minimum word score to add a word to the lookup table)

# -scale PSSM缩放因子。默认值为 100

# -dbtype输出数据库类型。可以是 cobalt、delta或 rps,默认值为 rps

# -index是否产生索引文件,默认值为true

# 运行搜索
rpsblast -query data/prot_query.fasta -outfmt 6 -evalue 1E-10 -out test.out -db Pfam

# -query为查询序列,fasta格式

# -outfmt输出格式,跟其它blast格式一样,有很多种选择,与其它blast结果类似,参考rpsblast -help

# -evalue自己设置evalue阈值,但是一般Domain的evalue都挺低的

# -out输出文件

# -db使用的数据库,是之前建好的

推荐课程

【课程】个人电脑上如何通过BLAST软件做比较基因组学分析

  • 点赞 (0人)
  • 收藏 (0人)
看不见的线
  • 课程数:
  • 文章数:
  • 学习人数: 0
关注
--- 作者文章 ---
  • 暂无内容
作者课程
  • 暂无内容
相关好课严选

官方微信公众号

客服热线:15618809518

【勤学如春起之苗,不见其增日有所长。假以时日,你定会为你的努力学习而倍感骄傲,加油!】