首页 / 文章汇 / 技能干货 / 生物数据库

生信分享 | GO,KEGG注释不理想?试试这款可视化软件--MapMan

  • 看不见的线
  • 1331
  • 2024-07-01 11:06:26
  • 文章来源:美吉生物

组学技术现在已经被广泛用于生命科学研究的方方面面。而面对大量的组学输入,数据又实在是太多了,这时,我们往往需要使用各种功能注释来进行可视化。

最常见的莫过于GO和KEGG pathway注释,但是对于做植物研究的小伙伴会发现,我们在分析时,往往会觉得GO注释太过宽泛,KEGG注释信息又太少或者总注释出一堆其他的物种信息来。

这时,不防试试我们这款老牌的,专门针对植物的分析软件--MapMan。MapMan大部分由人工整理的植物通路分析软件,在应用上,在以上两点完全地超越了GO和KEGG。

那么,怎么才能掌握MapMan软件使用方法、以及如何对自己的数据进行处理呢?本文将略过MapMan软件的安装,直接详解软件的使用。

01MapMan的作用物种

MapMan是GABI Primary Database完成的一个项目分析软件,很多支持的数据来源于TAIR team。最开始MapMan软件是为显示拟南芥Arabidopsis thaliana的基因芯片数据的代谢通路而开发的,顺理成章后续的很多作用物种都属于植物,如果您也有植物的代谢通路可视化需求,下面的介绍内容可要用心查看了。

那么,到目前为止,MapMan支持的物种有哪些呢?除了模式物种和常见植物之外,MapMan支持的物种还有Aquilegia coerulea,Brachypodium distachyon等,下表详细描述了支持物种的拉丁文,中文和其种属。

(点击查看大图)

上面的表格详细描述了MapMan软件作用的物种,可以通过该表格查阅感兴趣的物种或者近源物种。MapMan获取序列之后,和KEGG、COG、Swiss-Port、Gene-Ontology等数据库的序列进行blast得到了序列的生物学功能,然后将功能构建的功能树用于展示代谢通路。

02MapMan包含的通路

上面介绍了MapMan软件的通路来源,那么具体包含的通路有什么呢?通路按照生物学分类主要包括7大类,分别是Overview、primary metabolism、secondary metabolism、structure、horomones、custom(用户自己上传)和no category(未归类),层次目录示意如下:

(点击查看大图)

TCA的三个通路如下:

itochondrial_e-transport

TCA

C_TCA

03MapMan对数据处理

MapMan对数据的处理主要说的是如何将自己的数据转化成MapMan能用的数据,问题在于MapMan建立通路图时用的是芯片数据,与KEGG、COG、Swiss-Port、Gene-Ontology等数据库的比对也是芯片上探针的序列。

如果自己的数据也是芯片数据,直接输入到软件中进行处理就可以得到通路图片了;如果自己的数据不是芯片数据,是质谱或者测序的序列,处理办法是选取以上探针公司的序列fasta文件进行一次blast,将accession等转化成探针ID,然后将数据输入到软件处理也能得到定量的通路图片。

04 MapMan一般操作方式

前面介绍的[1] MapMan的作用物种,[2] MapMan包含的通路,[3] MapMan对数据处理都是对软件包含库的介绍和数据的前处理操作,这里将仔细介绍一般从数据到结果的操作。

软件界面

MapMan软件打开主要分成4个部分,分别是

a、软件操作和帮助;

b、文件操作窗口;

c、具体操作和显示界面;

d、系统状态显示(内存占用和运行时间)

导入数据矩阵

在“文件操作窗口”右键Experiments选择“Add Data”,然后选取数据矩阵,一般数据格式是第一列为Identifer,第二列以及之后是此identifer的鉴定量。

显示通路图

在“文件操作窗口”展开Pathways,寻找感兴趣的通路,比如显示代谢一览的通路,如封面展示的,可以通过Pathways->Overview->Metabolism_overview进行选择,然后双击选择对应的物种或者近源物种的‘mapping’, mapping即是MapMan项目与KEGG、COG、Swiss-Port、Gene-Ontology数据库对比得到的生物学注释分类文件。

映射数据矩阵数值

再回到导入数据矩阵的位置,双击刚刚导入的数据即可进行展示。正常情况应该能展示如下图,鼠标悬浮在映射颜色的点上可以查看该序列的详细信息。

调整图片

在顶部状态栏可以调节小色块的颜色的大小突出显示效果,通过调节色度条的卡值情况来区分代谢差距聚集的部分。

不能更改色块形状,因为色块形状有其具体的含义:方块表示转录本,圆形表示代谢物,三角形表示蛋白。

如果是blast得到的identifer应该自己按照映射要求调整色块形状

导出图片

MapMan导出图片很简单,但不代表导出图片的质量差。通过左上角File->Export as image调出导出图片的面板,可以选择jpg、png、gif以及bmp四种格式的图片,同时勾选“set resolution”可以调节图片的长度和分辨率,简单且高效。

总结

本文通过对MapMan软件作用的物种和其构建生物学通路两大方面出发,重点是解决植物的代谢通路可视化,如果不是芯片数据或者相同的物种,可以通过芯片序列文件做blast得到合适序列举证。

最后介绍了如何对数据进行可视化和图片调节导出,相信之后涉及植物的项目能想到用上MapMan这款软件让您的代谢通路更加清晰科学。

参考文献

[1]. Goffard N, Weiller G. Extending MapMan: application to legume genome arrays[J]. Bioinformatics, 2006, 22(23):2958.

[2]. Thimm O, Blaesing O, Gibon Y, Nagel A, Meyer S, Krüger P, Selbig J, Müller LA, Rhee SY and M Stitt (2004) MAPMAN: a user-driven tool to display genomics data sets onto diagrams of metabolic pathways and other biological processes. Plant J. 37(6):914-39

[3]. Usadel B, Nagel A, Thimm O, Redestig H, Blaesing OE, Palacios-Rojas N, Selbig J, Hannemann J, Piques MC, Steinhauser D, Scheible WR, Gibon Y, Morcuende R, Weicht D, Meyer S and M Stitt (2005), Extension of the visualization tool MapMan to allow statistical analysis of arrays, display of corresponding genes, and comparison with known responses. Plant Physiol. 138(3):1195-204.

[4]. Paulo F J, Seymour G B, Graham N S, et al. Analysis of ripening-related gene expression in papaya using an Arabidopsis -based microarray[J]. Bmc Plant Biology, 2012, 12(1):242-242.

转载自:美吉生物
  • 点赞 (0人)
  • 收藏 (0人)
看不见的线
  • 课程数:
  • 文章数:
  • 学习人数: 0
关注
--- 作者文章 ---
  • 暂无内容
作者课程
  • 暂无内容
相关好课严选

官方微信公众号

客服热线:15618809518

【勤学如春起之苗,不见其增日有所长。假以时日,你定会为你的努力学习而倍感骄傲,加油!】