扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。
网站建设哪家好,找成都创新互联!专注于网页设计、网站建设、微信开发、小程序定制开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了威信免费建站欢迎大家使用!
默认展示circ 数据前10个GO Term,通过参数 nsub 调整需要展示的GO Term chord_dat ()将作图数据构建成GOChord() 要求的输入格式;一个二进制的关系矩阵, 1 表示基因属于该GO Term, 0 与之相反。
经过上游的生信分析我们会获得许多具有生物学意义的gene set,可以是差异表达基因,也可是正选择基因或者加速进化基因。通常,只要具有这些基因的gene symbol或者是geneid,都可以利用该软件进行分析。
富集分析结果的可视化无非就是柱状图和气泡图,但是公司默认出图实在是太丑,所以还是自己动手修改修改。常规柱状图(ggplot2)横轴为gene counts,或者用-logP也行,填充相应的用P值或者gene counts。
最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了。气泡图 柱形图 这个图别说美观了,简直不忍直视。经过我的认真研究,发现跟R版本有关。
但是该方法存在一个很大的问题,那就是当x轴标签数量很多时,那么就无法通过这样的方法进行解决了。方法二是方法一的逆向思路,既然可以调大画布,那么反过来,我们也可以调小x轴标签字体。
最近小Q在做自然选择分析,分析完之后简单粗暴的对候选基因做了富集分析,并做了展示,比起气泡图,我模仿了另一种作图方式,显示效果更佳。所以想在此分享一下如何用R语言画富集分析示意图(非气泡图)。
在是否需要构建的问题上,我看到徐洲更在 功能注释后如何做富集分析 中提到 “你不需要构建Orgdb,因为Orgdb的用途是进行基因编号和GO/KEGG的转换。
单细胞富集分析我最常用的是 分组GSVA ,但最近用到了GO分析,就复习一下GO和KEGG富集分析及绘图。载入无比熟悉的pbmc.3k数据集 (已注释好,数据准备见 monocle )pbmc3k数据集只有1个样本,没办法区分HC和病例组。
单细胞富集分析我最常用的是 分组GSVA ,但最近用到了GO分析,就复习一下GO和KEGG富集分析及绘图。载入无比熟悉的pbmc.3k数据集 (已注释好,数据准备见 monocle )pbmc3k数据集只有1个样本,没办法区分HC和病例组。
3 GO富集分析 加载了注释库之后,读取基因列表文件,并使用clusterProfiler的内部函数enrichGO()即可完成GO富集分析。读取基因列表文件,并使用clusterProfiler的内部函数enrichKEGG()即可完成KEGG富集分析。
单细胞数据的分组包含不同细胞类型,对照组和实验组,不同时间段的样本等,可以按照不同的分组将表达量矩阵和细胞分组信息提取出来,再进行后续分析 。
GO、KEGG富集分析是我们做生信分析较为常用的部分,它可以将基因与功能相联系起来。GO指的是Gene Ontology,是基因功能国际标准分类体系。
GO是Gene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述 即对基因产物进行简单注释,通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。
通常称这种分析为GO、KEGG富集分析。本节视频教程,就让我们带大家学习什么是GO、KEGG富集分析,它们的主要原理是什么,并简单展示使用DAVID进行差异表达基因GO富集分析的操作过程。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流