前面我給大家詳細介紹過
創(chuàng)新互聯(lián)專注于磴口網(wǎng)站建設服務及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供磴口營銷型網(wǎng)站建設,磴口網(wǎng)站制作、磴口網(wǎng)頁設計、磴口網(wǎng)站官網(wǎng)定制、微信小程序服務,打造磴口網(wǎng)絡公司原創(chuàng)品牌,更為您提供磴口網(wǎng)站排名全網(wǎng)營銷落地服務。
?GO簡介及GO富集結果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風格展示結果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個圖別說美觀了,簡直不忍直視。經(jīng)過我的認真研究,發(fā)現(xiàn)跟R版本有關。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關的函數(shù)拿出來認真的研究了一下,終于發(fā)現(xiàn)的癥結所在。
dotplot這個函數(shù),多了個 label_format 參數(shù)
我們來看看這個參數(shù)究竟是干什么用的,看看參數(shù)說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個參數(shù)默認值是30,當標簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調(diào)節(jié)一下這個參數(shù),把他設置成100,讓我們的標簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復原來的容貌。
關于如何使用R做GO和KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
當富集分析完成,拿到如下的分析結果后,就可以進行作圖了。
富集分析結果的可視化無非就是柱狀圖和氣泡圖,但是公司默認出圖實在是太丑,所以還是自己動手修改修改。
一、常規(guī)柱狀圖(ggplot2)
橫軸為gene counts,或者用-logP也行,填充相應的用P值或者gene counts。ggplot畫圖的好處就是可以進行很多調(diào)整。
二、常規(guī)氣泡圖(ggplot2)
氣泡圖與柱狀圖如出一轍,只是在展示方式上出現(xiàn)了差別。一個用geom_bar()函數(shù),氣泡圖類似于散點圖用geom_point()函數(shù)。
三、上下調(diào)同時展示(ggplot2)
很多時候研究者拿到差異基因后,上下調(diào)基因是分別富集的,在展示上需要同時體現(xiàn)二者,我們之前提到metascape可以做到: 轉錄組不求人系列(十二): Cell文章最喜歡用的差異基因GO、KEGG富集分析工具 ,除此之外,之前講過的氣泡圖也可以展現(xiàn)多組的結果: 復現(xiàn)《nature communications》圖表(四):ggplot畫多組富集氣泡圖 。這里我們繼續(xù)提供一種bar圖的展示方式。將down的數(shù)值調(diào)整為負,做一列分組,就可以展示了。
當然了,以上所說的可視化還是比較常規(guī),在基礎上可以自己做調(diào)整。也有一些文章總是標新立意,有很多奇特的展現(xiàn)方式,我們會在之后的系列中講解。
單細胞富集分析系列:
單細胞富集分析我最常用的是 分組GSVA ,但最近用到了GO分析,就復習一下GO和KEGG富集分析及繪圖。
載入無比熟悉的pbmc.3k數(shù)據(jù)集 (已注釋好,數(shù)據(jù)準備見 monocle )
pbmc3k數(shù)據(jù)集只有1個樣本,沒辦法區(qū)分HC和病例組。
若有分組,可以使用subset函數(shù)將某種細胞取出,來做這種細胞病例組和對照組相比的差異基因和富集分析
之所以長短不齊不按順序是因為沒有排序
排完續(xù)之后再畫p值就是按順序的了
附: 單細胞測序數(shù)據(jù)的差異表達分析方法總結
2018年SCI論文--整合GEO數(shù)據(jù)挖掘完整復現(xiàn) 七 :DAVID在線工具進行KEGG富集分析_bioprogrammer-CSDN博客
“差異基因kegg注釋圖”是轉錄組分析結果的重要組成部分,能夠幫助大家了解差異基因分屬于哪些代謝通路,文章中如果能夠插入下面這類圖來說明樣品間的差異,一定會為你的文章增色不少。
下面給大家介紹一下如何在Windows下對差異基因進行kegg注釋。
一、輸入數(shù)據(jù)準備:
首先要準備的是各比較組(比如CK1比上Treat1)的差異基因列表,一般公司做完的標準分析結果里已經(jīng)包含這部分內(nèi)容了,通常在“DEG_Analysis”文件夾里,我們用到的信息是“ 基因ID ”和“ regulated ”(up代表上調(diào),down代表下調(diào))兩列,如下圖所示的第一列和最后一列:
接下來需要添加一列,將“regulated”里的“up”標記成“red”,“down”標記成“green”,這樣后面做出來的kegg注釋圖里上調(diào)基因就會顯示為紅色,下調(diào)基因顯示為綠色。具體方法是在第三列插入一個“ if ”函數(shù),當?shù)诙兄禐椤皍p”時輸出“red”,否則輸出“green”,參數(shù)設置詳見下圖:
這樣C2單元格就會顯示為“red”,雙擊該單元格右下角,這樣C列就都按上面的規(guī)則填充好了,如下圖所示:
二、在作圖網(wǎng)站填入數(shù)據(jù):
打開網(wǎng)站:
按照下方設置好參數(shù),并將第一步準備好的Excel表里的第一和第三列數(shù)據(jù)粘貼進去(注意:Excel表的 第一行 和 第二列 都不用粘貼),點擊左下角的“exec”按鈕開始運算。根據(jù)您提交的基因數(shù)量,等待一小段時間結果就出來了:
注釋到的代謝通路結果,按數(shù)量排序:
點擊其中的代謝通路鏈接,就能夠看出該代謝通路中哪些基因上調(diào)、哪些基因下調(diào)了。
好的,這樣差異基因的kegg注釋就完成了。掌握之后,便可在幾分鐘之內(nèi)做任意差異基因列表的kegg注釋圖而不用找公司了!
1. 文章越來越難發(fā)?是你沒發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡單快速,學習鏈接: 基因家族分析實操課程 、 基因家族文獻思路解讀
2. 轉錄組數(shù)據(jù)理解不深入?圖表看不懂?點擊鏈接學習深入解讀數(shù)據(jù)結果文件,學習鏈接: 轉錄組(有參)結果解讀 ; 轉錄組(無參)結果解讀
3. 轉錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次,學習鏈接: WGCNA-加權基因共表達網(wǎng)絡分析
4. 轉錄組數(shù)據(jù)怎么挖掘?學習鏈接: 轉錄組標準分析后的數(shù)據(jù)挖掘 、 轉錄組文獻解讀
5. 微生物16S/ITS/18S分析原理及結果解讀 、 OTU網(wǎng)絡圖繪制 、 cytoscape與網(wǎng)絡圖繪制課程
6. 生物信息入門到精通必修基礎課,學習鏈接: linux系統(tǒng)使用 、 perl入門到精通 、 perl語言高級 、 R語言畫圖
7. 醫(yī)學相關數(shù)據(jù)挖掘課程,不用做實驗也能發(fā)文章,學習鏈接: TCGA-差異基因分析 、 GEO芯片數(shù)據(jù)挖掘 、 GSEA富集分析課程 、 TCGA臨床數(shù)據(jù)生存分析 、 TCGA-轉錄因子分析 、 TCGA-ceRNA調(diào)控網(wǎng)絡分析
8.其他課程鏈接: 二代測序轉錄組數(shù)據(jù)自主分析 、 NCBI數(shù)據(jù)上傳 、 二代測序數(shù)據(jù)解讀 。
之前分享了如何用ggplot2可視化GO分析的結果。既然做了GO,當然少不了KEGG了。
同樣的,我們從 DAVID 獲取KEGG pathway的結果。
對于KEGG,我比較喜歡做氣泡圖,這樣用兩種形式的圖結合在一起,效果更豐富更好看一點。