不知不覺在單細胞轉(zhuǎn)錄組領域做知識分析也快兩年了,很幸運聚集了五個小伙伴攜手共進,我們承諾不間斷更新5個月,把我們這兩年的學習成果全部掏出來給大家,包括5個欄目:
文獻速遞(簡短介紹,擴充知識面)
文獻詳解(圖文并茂帶來大家系統(tǒng)性學習)
R與bioconductor技巧(書籍翻譯,妙招共享)
scRNAseq的GitHub書籍翻譯(原汁原味的名校教程)
全網(wǎng)第一個單細胞轉(zhuǎn)錄組視頻教程學習筆記分享
希望大家能有所收獲!??!
你現(xiàn)在看到的是讀者投稿(隨機欄目)
Every cell is unique—it occupies an exclusive position in space, carries distinct errors in its copied genome and is subject to programmed and induced changes in gene expression. Yet most DNA and RNA sequencing is performed on tissue samples or cell populations, in which biological differences between cells can be obscured by averaging or mistaken for technical noise.
---Nature Method
2009年,英國劍橋大學Gurdon研究所M. Azim Surani實驗室的Tang發(fā)表了第一篇單細胞轉(zhuǎn)錄組研究的文章。隨著測序成本的不斷降低和通量的不斷提高以及數(shù)據(jù)分析流程的標準化開源化,單細胞測序已經(jīng)在生物學各研究領域得到了廣泛的應用,單細胞測序的特點使得科學家們看待事物的角度發(fā)生了革命性的改變,傾向于在全局的角度發(fā)現(xiàn)細胞異質(zhì)性,傾向于研究發(fā)現(xiàn)細胞分化發(fā)展的動態(tài)變化過程。像是監(jiān)堂的老師,除了自己的肉眼外,又多了幾個高分辨率的監(jiān)控畫面,極大地推動了生物學各領域的研究。
單細胞測序技術目前主要應用于腫瘤、干細胞、發(fā)育生物學、神經(jīng)生物學、藥物研發(fā)等方面(排名不分先后)。10x Genomics商業(yè)平臺進駐市場后,單細胞測開始變得越來越普遍,畢竟大家都是'弄潮兒’。通常一個樣本就可以達到好幾千的細胞,所以一次10個樣本的實驗,拿到數(shù)萬個細胞的數(shù)據(jù)實屬正常。
通常我們將心愛的樣本送給公司建庫并測序后拿到初步處理(Cellranger)后的數(shù)據(jù),再經(jīng)過各種一站式單細胞轉(zhuǎn)錄組處理工具(monocle, seurat, scater 等)分析后,終于自己辛辛苦苦(拿時間和錢砸出來的)獲得了'小可愛們’(降維分群的結(jié)果),這里我們直接瞄一眼結(jié)果:
對這部分流程感興趣的童鞋公眾號搜索下這幾個包的名字就能找到更加詳細的說明(沒辦法,就是這么貼心)
官方回答:生物學中最基本的問題之一就是哪種類型的細胞以功能協(xié)調(diào)的方式形成不同的組織和器官,單細胞轉(zhuǎn)錄組分析依據(jù)算法得到的不同細胞群體,需要賦予其相應的生物學意義。通常是根據(jù)Marker gene來定義每一個細胞類群,可以是通過GO/KEGG數(shù)據(jù)庫進行功能富集。這樣得到的結(jié)果會比較粗糙,但對于類群不多,差異非常大的情形還是適用的。BUT上面例子的細胞類群太多,你們需要另擇他路。
幾乎每個做單細胞的小伙伴都會思考:如果有其他全面的可以參考的數(shù)據(jù)庫(必須有!別急),就再好不過了。下圖就是根據(jù)整理好的Marker gene數(shù)據(jù)庫,做出的映射,各細胞類群及其初步的比例或相互關系一目了然,是不是很棒~
CellMarker數(shù)據(jù)庫
這是哈爾濱醫(yī)科大學 Yun Xiao
老師等在2019年1月份發(fā)表于核酸研究 (Nucleic Acids Research)數(shù)據(jù)庫??墓ぷ?,訪問地址: http://biocc.hrbmu.edu.cn/CellMarker
該團隊通過梳理100,000+
發(fā)表的文獻,梳理出人的158
個組織 (亞組織)的467
個細胞類型的13,605
個Marker基因,和鼠的81
個組織 (亞組織)的389
個細胞類型的9, 148
個Marker基因。
主頁提供人和鼠的全局視圖:1. 通過單擊嵌入在網(wǎng)絡圖像中的超鏈接“人體或小鼠細胞的解剖位置”,快速探索細胞標記; 2. 單擊右上角的圖標可以切換至小鼠模式; 3. 通過人和小鼠的解剖位置,可以方便快速瀏覽所列細胞類型的細胞標記,單擊組織圖標可以顯示更詳細的細胞類型;4. 單擊細胞類型時,它將跳轉(zhuǎn)到與細胞類型相關的細胞標記基因的相應搜索結(jié)果。
瀏覽界面也很簡潔,頁面呈現(xiàn)細胞和組織的分層分類,包括人和小鼠兩個物種,從組織到細胞類型,邏輯很清晰。 1. 用戶可以通過單擊人(或鼠)的不同組織中的細胞類型來瀏覽細胞標記基因,并且可以返回匹配的細胞標記條目的完整列表。 例如,要瀏覽與人體脂肪組織相關的條目,您可以:2. 單擊“人體”,選擇“脂肪組織”;3. 找到感興趣的細胞類型,例如“脂肪來源的干細胞”;4. 相關的細胞標記將顯示在右側(cè)面板上,包括細胞類型的細胞標記和來自不同來源的條目的統(tǒng)計圖。檢索到的標志物,標志物的醒目程度反映了文獻支持數(shù)的多少(好喜歡這個細節(jié))!
另外,在結(jié)果部分還展示了這些cell type的來源(單細胞測序、實驗、綜述、公司等),非常方便大家尋找相應的來源并取舍,CellMarker不只是單細胞數(shù)據(jù)明確細胞類型聯(lián)系生物學意義的時候可以用,有些內(nèi)容對于濕實驗的小伙伴來說更具有參考價值。除此之外,用戶還可以:1. 通過輸入基因名稱,基因ID或蛋白質(zhì)名稱來搜索任何感興趣的基因,以查詢特定基因可以作為細胞標記的哪些組織的細胞類型;2~3. 點擊“提交”按鈕后,搜索引擎將返回一個交互式氣泡圖和一個顯示細胞標記綜合信息的表格。 交互式氣泡圖顯示了感興趣的基因在不同組織的不同細胞中用作細胞標記的頻率
Details點進去則是相關基因的信息,下方還鏈接了相關的支持文獻:
感興趣的小伙伴們可以登錄網(wǎng)站先行體驗一下,幫助里還有更詳細的的小Tips!
Mouse Cell Atlas
奉上重量級文章《Mapping the Mouse Cell Atlas by Microwell-Seq》鏈接:https://www.ncbi.nlm.nih.gov/pubmed/29474909
Mouse Cell Atlas通過對Microwell-seq對40多種組織器官和40W+的單細胞進行了測序并分析得到各組織器官的細胞分類及其相應的細胞類型,同樣這里也提供了方便讀者的網(wǎng)頁可視化搜索(http://bis.zju.edu.cn/MCA/gallery.html),用戶可以根據(jù)器官和基因名在數(shù)據(jù)庫中搜索得到自己想要的結(jié)果。例如我們通過分析測序數(shù)據(jù)得到了一系列的細胞類型,往往這些細胞類型被分成了諸多亞型,此時則可在特定組織器官的數(shù)據(jù)庫下對比相應的marker gene來確定自己的細胞類型并對其進行歸一或細分。下圖顯示的是小鼠的不同組織器官,用戶可根據(jù)自己感興趣的方向點進去就會顯示該組織單細胞測序的tSNE圖及其相應的分群和細胞類型marker。這個數(shù)據(jù)庫最大的優(yōu)點就是所涵蓋的小鼠組織器官特別全面(雖然沒有涵蓋所有的研究領域),相信絕大部分做小鼠的小伙伴都不會錯過
為了滿足大家的求知欲,減輕服務器的負擔,scMCA還在github放了R包https://github.com/ggjlab/scMCA,感興趣的小伙伴可以自行安裝體驗一下:
可能會有小伙伴們發(fā)現(xiàn)自己的單細胞數(shù)據(jù)分析結(jié)果和數(shù)據(jù)庫中的Marker會有偏差,不要驚慌!小編有個習慣就是在使用一個數(shù)據(jù)庫的時候先看一下背景介紹和幫助,非常有助于大家正確地學習使用數(shù)據(jù)庫,拿此數(shù)據(jù)庫為例,大家仔細看一下數(shù)據(jù)庫的背景就可以發(fā)現(xiàn)數(shù)據(jù)庫并不是完美的(成本太高啊?。?,建庫方法和分析流程也會產(chǎn)生一定得誤差。但是,對于研究小鼠的(特別是發(fā)育研究)客官們來說,這絕對是目前最好用的小鼠單細胞轉(zhuǎn)錄組數(shù)據(jù)庫之一了!
八卦放在最后,郭國驥教授在中國原創(chuàng)音樂基地有很多原創(chuàng)歌曲,底下評論說,是被科研耽誤的原創(chuàng)歌手哦。https://www.sohu.com/a/224004856_503422
PanglaoDB
PanglaoDB的定位是對小鼠和人類scRNA-seq感興趣的科學界的數(shù)據(jù)庫(https://panglaodb.se),該數(shù)據(jù)庫收集并整合來自多個研究的數(shù)據(jù)(來自小鼠的170種組織954個樣本近400W細胞和來自人的68種組織279個樣本100w+細胞),并通過統(tǒng)一的框架呈現(xiàn)它們。例如在搜索細胞類型Markers的時候,用戶可以根據(jù)細胞或組織類型來進行的篩選,選定后就可以呈現(xiàn)出相應的Marker了
當搜索單個基因時,可根據(jù)數(shù)據(jù)庫主頁的介紹和使用(都寫得很清晰),點擊search就可以愉快地探索了:
signatureDB
來源于文章:Genetics and Pathogenesis of Diffuse Large B-Cell Lymphoma. 發(fā)表2018新英格蘭雜志。
https://www.ncbi.nlm.nih.gov/pubmed/29641966
數(shù)據(jù)以表格的形式進行展示,鏈接放在下面,大家可以自行下載研究:
SignatureDB (Excel)
SignatureDB annotation (Excel)
最后在此提醒大家最好是在詳細了解明確各大數(shù)據(jù)庫的優(yōu)缺點,明確所檢索到的Marker的相關文獻及研究背景后(例如:轉(zhuǎn)錄組層面的Marker在表達量和時間空間上并不一定完全和蛋白質(zhì)組學對應;參考文獻是否可靠等),再結(jié)合自己的課題斟酌著對自己的'小可愛們'下定義,數(shù)據(jù)庫只是作為一種參考。隨著測序技術的持續(xù)發(fā)展和成本的不斷降低,多組學的合并研究(轉(zhuǎn)錄組、蛋白質(zhì)組、表觀組等)和單分子成像技術(MERFISH、SeqFISH、RNAScope和DNA FISH等)的推廣,相信各大數(shù)據(jù)庫們會越來越完善。關于各數(shù)據(jù)庫的其他細節(jié)就不再劇透了,大家自行探索研究吧!
如何你對單細胞轉(zhuǎn)錄組研究感興趣,但又不知道如何入門,也許你可以關注一下下面的課程
單細胞天地歡迎你
最后,再次感謝南方醫(yī)的小伙伴分享自己的學習心得,也希望讀者受感染和鼓舞加入我們創(chuàng)作分享隊伍。