生信分享 | GO,KEGG注释不理想?试试这款可视化软件--MapMan
- 看不见的线
- 844
- 2024-07-01 11:06:26
- 文章来源:美吉生物
组学技术现在已经被广泛用于生命科学研究的方方面面。而面对大量的组学输入,数据又实在是太多了,这时,我们往往需要使用各种功能注释来进行可视化。
最常见的莫过于GO和KEGG pathway注释,但是对于做植物研究的小伙伴会发现,我们在分析时,往往会觉得GO注释太过宽泛,KEGG注释信息又太少或者总注释出一堆其他的物种信息来。
这时,不防试试我们这款老牌的,专门针对植物的分析软件--MapMan。MapMan大部分由人工整理的植物通路分析软件,在应用上,在以上两点完全地超越了GO和KEGG。
那么,怎么才能掌握MapMan软件使用方法、以及如何对自己的数据进行处理呢?本文将略过MapMan软件的安装,直接详解软件的使用。
01MapMan的作用物种
MapMan是GABI Primary Database完成的一个项目分析软件,很多支持的数据来源于TAIR team。最开始MapMan软件是为显示拟南芥Arabidopsis thaliana的基因芯片数据的代谢通路而开发的,顺理成章后续的很多作用物种都属于植物,如果您也有植物的代谢通路可视化需求,下面的介绍内容可要用心查看了。
那么,到目前为止,MapMan支持的物种有哪些呢?除了模式物种和常见植物之外,MapMan支持的物种还有Aquilegia coerulea,Brachypodium distachyon等,下表详细描述了支持物种的拉丁文,中文和其种属。
(点击查看大图)
上面的表格详细描述了MapMan软件作用的物种,可以通过该表格查阅感兴趣的物种或者近源物种。MapMan获取序列之后,和KEGG、COG、Swiss-Port、Gene-Ontology等数据库的序列进行blast得到了序列的生物学功能,然后将功能构建的功能树用于展示代谢通路。
02MapMan包含的通路
上面介绍了MapMan软件的通路来源,那么具体包含的通路有什么呢?通路按照生物学分类主要包括7大类,分别是Overview、primary metabolism、secondary metabolism、structure、horomones、custom(用户自己上传)和no category(未归类),层次目录示意如下:
(点击查看大图)
TCA的三个通路如下:
itochondrial_e-transport
TCA
C_TCA
03MapMan对数据处理
MapMan对数据的处理主要说的是如何将自己的数据转化成MapMan能用的数据,问题在于MapMan建立通路图时用的是芯片数据,与KEGG、COG、Swiss-Port、Gene-Ontology等数据库的比对也是芯片上探针的序列。
如果自己的数据也是芯片数据,直接输入到软件中进行处理就可以得到通路图片了;如果自己的数据不是芯片数据,是质谱或者测序的序列,处理办法是选取以上探针公司的序列fasta文件进行一次blast,将accession等转化成探针ID,然后将数据输入到软件处理也能得到定量的通路图片。
04 MapMan一般操作方式
前面介绍的[1] MapMan的作用物种,[2] MapMan包含的通路,[3] MapMan对数据处理都是对软件包含库的介绍和数据的前处理操作,这里将仔细介绍一般从数据到结果的操作。
软件界面
MapMan软件打开主要分成4个部分,分别是
a、软件操作和帮助;
b、文件操作窗口;
c、具体操作和显示界面;
d、系统状态显示(内存占用和运行时间)
导入数据矩阵
在“文件操作窗口”右键Experiments选择“Add Data”,然后选取数据矩阵,一般数据格式是第一列为Identifer,第二列以及之后是此identifer的鉴定量。
显示通路图
在“文件操作窗口”展开Pathways,寻找感兴趣的通路,比如显示代谢一览的通路,如封面展示的,可以通过Pathways->Overview->Metabolism_overview进行选择,然后双击选择对应的物种或者近源物种的‘mapping’, mapping即是MapMan项目与KEGG、COG、Swiss-Port、Gene-Ontology数据库对比得到的生物学注释分类文件。
映射数据矩阵数值
再回到导入数据矩阵的位置,双击刚刚导入的数据即可进行展示。正常情况应该能展示如下图,鼠标悬浮在映射颜色的点上可以查看该序列的详细信息。
调整图片
在顶部状态栏可以调节小色块的颜色的大小突出显示效果,通过调节色度条的卡值情况来区分代谢差距聚集的部分。
不能更改色块形状,因为色块形状有其具体的含义:方块表示转录本,圆形表示代谢物,三角形表示蛋白。
如果是blast得到的identifer应该自己按照映射要求调整色块形状
导出图片
MapMan导出图片很简单,但不代表导出图片的质量差。通过左上角File->Export as image调出导出图片的面板,可以选择jpg、png、gif以及bmp四种格式的图片,同时勾选“set resolution”可以调节图片的长度和分辨率,简单且高效。
总结
本文通过对MapMan软件作用的物种和其构建生物学通路两大方面出发,重点是解决植物的代谢通路可视化,如果不是芯片数据或者相同的物种,可以通过芯片序列文件做blast得到合适序列举证。
最后介绍了如何对数据进行可视化和图片调节导出,相信之后涉及植物的项目能想到用上MapMan这款软件让您的代谢通路更加清晰科学。
参考文献
[1]. Goffard N, Weiller G. Extending MapMan: application to legume genome arrays[J]. Bioinformatics, 2006, 22(23):2958.
[2]. Thimm O, Blaesing O, Gibon Y, Nagel A, Meyer S, Krüger P, Selbig J, Müller LA, Rhee SY and M Stitt (2004) MAPMAN: a user-driven tool to display genomics data sets onto diagrams of metabolic pathways and other biological processes. Plant J. 37(6):914-39
[3]. Usadel B, Nagel A, Thimm O, Redestig H, Blaesing OE, Palacios-Rojas N, Selbig J, Hannemann J, Piques MC, Steinhauser D, Scheible WR, Gibon Y, Morcuende R, Weicht D, Meyer S and M Stitt (2005), Extension of the visualization tool MapMan to allow statistical analysis of arrays, display of corresponding genes, and comparison with known responses. Plant Physiol. 138(3):1195-204.
[4]. Paulo F J, Seymour G B, Graham N S, et al. Analysis of ripening-related gene expression in papaya using an Arabidopsis -based microarray[J]. Bmc Plant Biology, 2012, 12(1):242-242.
-
点赞 (0人)
- 收藏 (0人)
-
上一篇: 没有了
- 下一篇: 常见的MLST在线分析网站