爾云間? 一個專門做科研的團隊
原創?小果?生信果?關注我們
(資料圖片)
小伙伴們好啊,小果和大家又見面了,大家在做GSEA分析的時候有沒有想過,那些富集用的數據庫里面有哪些基因,我們找基因集的時候能不能從這個數據庫里找,接下來就讓我們一起來了解一下吧。
Gene Set Enrichment Analysis,中文名稱為基因集富集分析,是由Broad Institute研究所的科學家提出的一種富集方法,在提出該方法的同時還對應提供了分析的軟件GSEA和一個基因集數據庫MSigDB。
對于human的基因,從位置,功能,代謝途徑,靶標結合等多種角度出發,構建出了許多的基因集合,一個基因集合中就是具有相近位置或類似功能的許多基因的,Broad Institute研究所將它們構建的基因集合保存在MSigDB數據庫中。
這里的基因集有九個大類
01H: hallmark gene sets
該類別包含了由多個已知的基因集構成的超基因集,每個H類別的基因集都對應多個基礎的其他類別的基因集。共包含50個基因集。
02C1: positional gene sets
該類別包含人類每條染色體上的不同cytoband區域對應的基因集合。根據不同染色體編號進行二級分類。包含299個基因集。
03?C2:curated gene sets
該類別包含了已知數據庫,文獻和專家支持的基因集信息。
04?C3 : regulatory target gene sets
該類別包含了miRNA靶基因和轉錄因子結合區域等基因集合。
05C4 : computational gene sets
該類別包含計算機軟件預測出來的基因集合,主要是和癌癥相關的基因。
06C5 : GO gene sets
該類別包含了Gene Ontology對應的基因集合,分為3大類別,即BP,MF,CC。
每個基因集對應一個GO term。
07C6 : oncogenic signatures
該類別包含已知條件處理后基因表達量發生變化的基因,包括189個基因集。
08C7 : immunologic signatures
該類別包含了免疫系統功能相關的基因集合。
09C8 : cell type signature gene sets
包含在人類組織的單細胞測序研究中確定的細胞類型的簇標記物的基因集,共包含700個基因集。
功能通路的開頭可以幫助我們快速找到想要的基因集,如HP_SEVERE_LACTIC_ACIDOSIS,HP開頭,需要在C5的HPO里找。
好了,小伙伴們,這就是今天的主要內容了,小伙伴們有什么問題歡迎和小果討論分享啊
推薦閱讀
多種花樣都能懂,富集圖的看法
相關性圖譜之相關性熱圖學習
小果教你快速優雅使用Genecards數據庫
從UCSC下載TCGA數據
簡單高效利用Batch Entrez批量獲取基因別名
關注小果,小果將會持續為你帶來更多生信干貨哦。
“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復現、生信硬核知識技能、服務器、生物信息學的教程,以及基于R的分析和可視化等原創內容,一起見證小白和大佬的成長。?
關鍵詞:
責任編輯:Rex_25