上海俊辅-艾辅生物科技有限公司
Shanghai JunFu-AiFu life science

KEGG Pathway通路二级分类汇总

做完通路富集分析,拿到几十条富集通路后,我们经常会寻找与“某关键词”相关的通路。例如与癌症相关的通路,与免疫相关的通路,与代谢相关的通路等等。单纯从名字来看,面对几十甚至上百个英文通路名,一时半会还真分不清。今天,给大家带来一款实用的KEGG Pathway通路汇总小工具。使用这款工具,我们可以快速找到感兴趣的通路,例如癌症相关通路,免疫相关通路等,并最终汇总成一张美图。

汇总原理

KEGG官网页面上给出了所有pathway的名字及其隶属关系,分成三个级别。

一级分类:共7个,分别是Metabolism(代谢)、Genetic Information Processing(遗传信息处理)、Environmental Information Processing(环境信息处理)、Cellular Processes(细胞过程)、Organismal Systems(有机系统)、Human Diseases(人类疾病)和Drug Development(药物开发)。


图1. 一级分类

二级分类:在一级分类下面的分类,例如一级分类Cellular Processes下面包括5个二级分类:Transport and catabolism、Cell growth and death、Cellular community – eukaryotes、Cellular community – eukaryotes和Cell motility。

三级分类:二级分类下面的分类,例如二级分类Cell motility下面包括3个三级分类:Bacterial chemotaxis、Flagellar assembly和Regulation of actin cytoskeleton。

我们富集分析的结果一般都是三级分类,因此使用二级分类对三级分类进行汇总,可以快速找到相关的通路。例如Cell growth and death(细胞生长与死亡)相关通路。


图2. 一、二、三级分类

1,打开绘图页面

首先,使用浏览器(推荐chrome或者edge)打开KEGG Pathway二级分类汇总绘制页面。左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。也可以在搜索框中搜索pathway,找到绘图页面。

http://www.bioinformatics.com.cn/plot_basic_pathway_enrichment_second_class_summary_bar_plot_206


图3.可视化绘图页面

2,示例数据

点击右侧“示例数据”链接下载excel格式的示例数据。

图4. 输入数据示例

示例数据(仅供参考)包括两列:

第一列是富集的pathway通路名字;

第二列是【该富集通路中包含的基因】与【做富集分析时所输入的基因】的交集基因个数。

3,粘贴示例数据

直接拷贝示例数据中的AB两列数据,然后粘贴到输入框。

注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。同时数据矩阵中不能有空的单元格,中文字符等。


图5. 必需输入

4,修改参数,并提交

我们设置了图片尺寸、文字大小、颜色、字体等参数,基本能满足日常绘图使用。如需更高级的定制,请联系我们。


图6.颜色、字体等可调参数

5,提交出图

粘贴好输入数据,调整好参数(重点是X轴最大值的参数)后,点击提交按钮,几秒钟后,会在页面右侧出现预览图。我们提供了4种图片格式供下载使用,两种矢量图(pdf,svg)和两种标量图(600 dpi tiff和300 dpi png),及汇总表格。

图7.预览与下载

结果说明

1)图中左侧黑色粗体为一级分类名,共6个(去掉了Drug Development),其余为二级分类名,同一级别的名字用相同颜色显示。右侧条形为隶属于该分类的基因数之和,可以很方便地看出二级分类名字及基因数。

2)由于不同的富集工具使用的名字略有不同,因此若存在与KEGG官网不一致的名字,请根据提示,调整后重新提交作图。

3)我们还提供了带有一级、二级及三级分类的汇总结果表格供下载。表格形式见图8。

图8.汇总结果表格


昵称:
内容:
验证码:
提交评论
评论一下