10分钟掌握MapMan,实现通路可视化(转自美吉生物微信公众号)

  • 2017-09-21 20:39:39
  • 46
  • 0
概要:MapMan可以通过点的多少和颜色深浅显示通路表达信号的强弱,从而展示差异变化的代谢通路。本文将略过MapMan软件的安装,直接详解软件的使用。

转载地址:

 
    MapMan是一款和KEGG以及iPATH风格不同的代谢分析软件,主要作用物种是植物。通过点的多少和颜色深浅显示通路表达信号的强弱。那么,怎么才能掌握MapMan软件使用方法、以及如何对自己的数据进行处理呢?
    本文将略过MapMan软件的安装,直接详解软件的使用。主要包括以下几方面:[1]MapMan的作用物种,[2]MapMan包含的通路,[3]MapMan对数据处理,[4]MapMan一般操作方式来介绍软件使用。

[1]MapMan的作用物种
    MapMan是GABI Primary Database完成的一个项目分析软件,很多支持的数据来源于TAIR team。最开始MapMan软件是为显示拟南芥Arabidopsis thaliana的基因芯片数据的代谢通路而开发的,顺理成章后续的很多作用物种都属于植物,如果您也有植物的代谢通路可视化需求,下面的介绍内容可要用心查看了。
    那么,到目前为止,MapMan支持的物种有哪些呢?除了Arabidopsis thaliana,Oryza sativa Japonica Group这样的模式物种和Solanum lycopersicum和Zea mays这样的常见植物之外,MapMan支持的物种还有Aquilegia coerulea,Brachypodium distachyon等,下表详细描述了支持物种的拉丁文,中文和其种属。

    上面的表格详细描述了MapMan软件作用的物种,可以通过该表格查阅感兴趣的物种或者近源物种。MapMan获取序列之后,和KEGG、COG、Swiss-Port、Gene-Ontology等数据库的序列进行blast得到了序列的生物学功能,然后将功能构建的功能树用于展示代谢通路。

[2]MapMan包含的通路
    上面介绍了MapMan软件的通路来源,那么具体包含的通路有什么呢?通路按照生物学分类主要包括7大类,分别是Overview、primary metabolism、secondary metabolism、structure、horomones、custom(用户自己上传)和no category(未归类)。拿其中的初级代谢primary metabolism来说,又可以细分为:photosynthesis、Lipid Biosynthesis、tetrapyrrole、Nucleotide Synthesis、Inositol Phosphates、Amino Acids、Sugar and Sugar Derivatives、Energy (TCA, mitochondria)等共七类,其中Energy又有Mitochondrial_e-transport、TCA、C_TCA三种,层次目录示意如下:

    eg:TCA的三个通路如下,从左至右依次是itochondrial_e-transport、TCA、C_TCA

itochondrial_e-transport

TCA

C_TCA


[3]MapMan对数据处

    MapMan对数据的处理主要说的是如何将自己的数据转化成MapMan能用的数据,问题在于MapMan建立通路图时用的是芯片数据,与KEGG、COG、Swiss-Port、Gene-Ontology等数据库的比对也是芯片上探针的序列,主要的来源是Affymetrix、AGILENT、Phytozome 、TAIR等,如果自己的数据也是芯片数据,直接输入到软件中进行处理就可以得到通路图片了;如果自己的数据不是芯片数据,是质谱或者测序的序列,处理办法是选取以上探针公司的序列fasta文件进行一次blast,将accession等转化成探针ID,然后将数据输入到软件处理也能得到定量的通路图片。

[4]MapMan一般操作方式
    前面介绍的[1]MapMan的作用物种,[2]MapMan包含的通路,[3]MapMan对数据处理都是对软件包含库的介绍和数据的前处理操作,这里将仔细介绍一般从数据到结果的操作。


    1)软件界面:

    MapMan软件打开主要分成4个部分,分别是
    a、软件操作和帮助;
    b、文件操作窗口;
    c、具体操作和显示界面;
    d、系统状态显示(内存占用和运行时间)


    2)导入数据矩阵

    在“文件操作窗口”右键Experiments选择“Add Data”,然后选取数据矩阵,一般数据格式是第一列为Identifer,第二列以及之后是此identifer的鉴定量。


    3)显示通路图片

    在“文件操作窗口”展开Pathways,寻找感兴趣的通路,比如显示代谢一览的通路,如封面展示的,可以通过Pathways->Overview->Metabolism_overview进行选择,然后双击选择对应的物种或者近源物种的’mapping’,mapping即是MapMan项目与KEGG、COG、Swiss-Port、Gene-Ontology数据库对比得到的生物学注释分类文件。
    映射数据矩阵数值
    再回到导入数据矩阵的位置,双击刚刚导入的数据即可进行展示。正常情况应该能展示如下图,鼠标悬浮在映射颜色的点上可以查看该序列的详细信息。


    5) 调整图片

    在顶部状态栏可以调节小色块的颜色的大小突出显示效果,通过调节色度条的卡值情况来区分代谢差距聚集的部分。
    不能更改色块形状,因为色块形状有其具体的含义:方块表示转录本,圆形表示代谢物,三角形表示蛋白。
    如果是blast得到的identifer应该自己按照映射要求调整色块形状

    6) 导出图片
    MapMan导出图片很简单,但不代表导出图片的质量差。通过左上角File->Export as image调出导出图片的面板,可以选择jpg、png、gif以及bmp四种格式的图片,同时勾选“set resolution”可以调节图片的长度和分辨率,简单且高效。

总结

    本文通过对MapMan软件作用的物种和其构建生物学通路两大方面出发,重点是解决植物的代谢通路可视化,如果不是芯片数据或者相同的物种,可以通过芯片序列文件做blast得到合适序列举证,最后介绍了如何对数据进行可视化和图片调节导出。相信之后涉及植物的项目能想到用上MapMan这款软件让您的代谢通路更加清晰科学。


参考文献:
[1] Goffard N, Weiller G。 Extending MapMan: application to legume genome arrays[J]。 Bioinformatics, 2006, 22(23):2958。
[2] Thimm O, Blaesing O, Gibon Y, Nagel A, Meyer S, Krüger P, Selbig J, Müller LA, Rhee SY and M Stitt (2004) MAPMAN: a user-driven tool to display genomics data sets onto diagrams of metabolic pathways and other biological processes. Plant J. 37(6):914-39.
[3] Usadel B, Nagel A, Thimm O, Redestig H, Blaesing OE, Palacios-Rojas N, Selbig J, Hannemann J, Piques MC, Steinhauser D, Scheible WR, Gibon Y, Morcuende R, Weicht D, Meyer S and M Stitt (2005), Extension of the visualization tool MapMan to allow statistical analysis of arrays, display of corresponding genes, and comparison with known responses。 Plant Physiol。 138(3):1195-204。
[4] Paulo F J, Seymour G B, Graham N S, et al. Analysis of ripening-related gene expression in papaya using an Arabidopsis -based microarray[J]. Bmc Plant Biology, 2012, 12(1):242-242.

评论

全部评论()
查看更多评论
湖北快三 湖北快三 湖北11选5 湖北快三 湖北快三 湖北快三 湖北11选5 湖北快三 湖北11选5 湖北快三