首页 / 文章汇 / 技能干货 / 生物数据库

KEGG数据库数据深入挖掘解析

在微生物测序如此之火爆的时代,基于16s测序,无论是物种分布及复杂度分析还是组间biomarker寻找,都已经被玩转的炉火纯青。然而,作为16s测序的升级版,高大上的宏基因组测序产品总是让人感觉有一层看不透的朦胧美。作为宏基因组测序产品里面的关键组成部分,利用KEGG数据库挖掘组间功能基因及代谢通路差异是解读宏基因组产品的关键。

今天小编带大家一起深刨宏基因组功能注释的KEGG数据库,并解读诺禾致源宏基因组结题报告KEGG部分。

内容预览

1.KEGG数据库的简介

2.KEGG数据库分类

3.KEGG Pathway

4.诺禾致源宏基因组KEGG 数据库中代谢通路分析及进行基因差异分析解析

5.如何在KEGG 数据库中,查找Pathway, Gene, KO

6. 结语

1、KEGG数据库的简介

KEGG数据库,是系统分析基因产物和化合物在细胞中的代谢途径以及这些基因产物的功能,用于物种的基因组或转录组的功能注释的一个综合性数据库。

2、KEGG数据库分类

KEGG全称为Kyoto Encyclopedia of Genes and Genomes,它全面整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(KEGG Pathway)、药物(KEGG Drug)、疾病(KEGG Disease)、功能模型(KEGG Module)、基因序列(KEGG Genes)及基因组(KEGG Genome)等等。如下图:

点击下方阅读原文见KEGG数据库官网

3、KEGG Pathway

KEGG 数据库最核心的为 KEGG Pathway 和 KEGG Orthology 数据库。在 KEGG Orthology 数据库中,将行使相同功能的基因聚在一起,称为 Ortholog Groups (KO entries),每个 KO 包含多个基因信息,并在一至多个 pathway 中发挥作用。而在 KEGG Pathway数据库中,将生物代谢通路划分为 6 类,分别为:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems)。

4、诺禾致源宏基因组KEGG 数据库中代谢通路分析及进行基因差异分析解析

为了研究不同分组(不同样品)在代谢通路图中的差异,诺禾致源宏基因组分析绘制了代谢通路网页版结果展示,整体网页版报告分为两部分,如下图:第一部分为两个分组共有及特有的代谢通路信息,第二部分为所有分组中注释到的Pathway代谢通路图。

第一部分:为两个分组共有及特有的代谢通路信息,点击“please click”,即可看到两个分组具体的代谢通路信息,如下图:

根据研究的课题,选取自己关注的代谢通路,比如点击map 00350(Metabolism,Amino acid metabolism,Tyrosine metabolism),结果如下图,图中节点代表各种化合物,边代表一系列的酶类反应,红色代表两个分组共有的酶类反应,蓝色代表分组 A独有的酶类反应,绿色代表分组 B(或样品 B)独有的酶类反应,点击酶边框,以途中蓝色边框为例,即可链接到KEGG官网,直接查看该酶的信息,从而结合研究背景及选样研究造成该差异的原因;

第二部分:为所有分组中注释到的Pathway代谢通路图,点击任一PathwayID,即可得到如下所示通路图,在代谢通路图中,节点代表各种化合物, 方框代表酶类信息(默认边框为黑色,背景为白色),不同颜色的方框代表注释为该酶类的基因的数目的多少,黄色背景的酶类代表在分组间具有显著差异的酶类,鼠标移动至该酶类,可显示差异酶类在不同分组间的丰度分布箱图。

5、如何在KEGG 数据库中,查找Pathway, Gene, KO

方法1:在KEGG首页,最上方,提供了一个综合搜索的界面,输入Pathway,Gene, KO 的英文关键字,即可进行搜索,注意,因为是综合搜索界面,搜索时,会搜索KEGG 中所有的数据库。

通过百度等搜索方法搜索关注的具体的Pathway的专业描述,比如,搜索氧化磷酸化,(Oxidative phosphorylation),并点击搜索,即可得到如下的结果。从上述结果中看出,搜索得到的结果,具有KEGG Pathway的信息,我们想要的KEGG Orthology, KEGG Pathway的信息。

方法2: 除了第一种方式外,也可以如下方图片中,下面的三个红色方框所示,直接进入到对应的专门的数据库的界面中,在这些数据库的界面中,会含有该数据库的搜索栏,直接输入关键字,进行搜索即可。

6、结语

一口气说了这么多,总归是一点,除了我们要熟知怎么利用KEGG数据库查询功能信息之外,结合自身的研究背景,去关联所发现的差异基因或者差异功能也是至关重要的。

转载自:诺禾致源科服
  • 点赞 (0人)
  • 收藏 (0人)
看不见的线
  • 课程数:
  • 文章数:
  • 学习人数: 0
关注
--- 作者文章 ---
  • 暂无内容
作者课程
  • 暂无内容
相关好课严选

官方微信公众号

客服热线:15618809518

【勤学如春起之苗,不见其增日有所长。假以时日,你定会为你的努力学习而倍感骄傲,加油!】