單細(xì)胞測(cè)序做為近十年最偉大的科學(xué)技術(shù)之一,它的應(yīng)用在很多科研領(lǐng)域均產(chǎn)生了深刻的影響。單細(xì)胞測(cè)序技術(shù)解決了很多在bulk測(cè)序上解決不了的單個(gè)細(xì)胞尺度上的機(jī)制研究,這使其已經(jīng)成為一種現(xiàn)象級(jí)研究手段。做為一種適應(yīng)性很廣,功能多樣的測(cè)序技術(shù),它在研究腫瘤抑制性,免疫細(xì)胞和神經(jīng)系統(tǒng)復(fù)雜性上有突出的優(yōu)勢(shì)。除了迅速增長(zhǎng)的單細(xì)胞測(cè)序數(shù)據(jù)之外,各種基于單細(xì)胞測(cè)序的生信分析工具也得以快速發(fā)展。雖然單細(xì)胞測(cè)序技術(shù)最常用于腫瘤研究,而近些年在非腫瘤領(lǐng)域也在迅速增長(zhǎng),考慮到大家也有關(guān)注非腫瘤研究領(lǐng)域,并且腫瘤研究的單細(xì)胞數(shù)據(jù)庫(kù)也都被介紹的很多。所以小編系統(tǒng)整理了截止到2022年初所有的非腫瘤單細(xì)胞數(shù)據(jù)庫(kù),今天隨推文一起分享給大家,此外我們還整理了具體疾病的單細(xì)胞數(shù)據(jù)集,有需要的文章最下方歡迎掃碼領(lǐng)取。
以下對(duì)非腫瘤單細(xì)胞數(shù)據(jù)庫(kù)的介紹主要分為三種類型:第一種是大型綜合單細(xì)胞數(shù)據(jù)庫(kù),這種數(shù)據(jù)庫(kù)多是多項(xiàng)重大研究成果的產(chǎn)物,其主要是作為單細(xì)胞數(shù)據(jù)儲(chǔ)存的數(shù)據(jù)庫(kù);第二種是疾病特異性單細(xì)胞數(shù)據(jù)庫(kù),這種非腫瘤單細(xì)胞數(shù)據(jù)庫(kù)收錄的數(shù)據(jù)就沒(méi)有第一種多,主要是針對(duì)具體的疾病類型進(jìn)行數(shù)據(jù)整理;第三種是單細(xì)胞功能分析數(shù)據(jù)庫(kù),這種數(shù)據(jù)庫(kù)是針對(duì)某一項(xiàng)科學(xué)問(wèn)題,對(duì)單細(xì)胞數(shù)據(jù)進(jìn)行功能分析的數(shù)據(jù)庫(kù),我們可以使用這種數(shù)據(jù)庫(kù)完成對(duì)單細(xì)胞數(shù)據(jù)的某項(xiàng)具體的功能分析。
一.大型綜合單細(xì)胞數(shù)據(jù)庫(kù)
1.Human cell atlas(HCA):人類細(xì)胞圖譜計(jì)劃,迄今為止項(xiàng)目最龐大的單細(xì)胞測(cè)序項(xiàng)目成果。聚焦人正常組織,獲取人體各個(gè)組織器官的單細(xì)胞層面數(shù)據(jù)均可使用這個(gè)網(wǎng)站進(jìn)行下載。https://data.humancellatlas.org/2.SCXA:EBI旗下的單細(xì)胞數(shù)據(jù)庫(kù),收錄了各種疾病類型的單細(xì)胞數(shù)據(jù),而且這個(gè)網(wǎng)站持續(xù)更新。由于EBI旗下還有很多bulk RNA數(shù)據(jù)庫(kù)和功能分析數(shù)據(jù)庫(kù),這個(gè)網(wǎng)站均可無(wú)縫連接到相應(yīng)數(shù)據(jù)庫(kù)。
https://www.ebi.ac.uk/gxa/sc/home3.Single Cell Portal:目前收錄412個(gè)研究中的1800萬(wàn) 的單細(xì)胞數(shù)據(jù)庫(kù),而且持續(xù)更新,數(shù)據(jù)維護(hù)的很好,還可以進(jìn)行簡(jiǎn)單的在線分析。https://singlecell.broadinstitute.org/single_cell4.SCPortalen:日本的單細(xì)胞測(cè)序數(shù)據(jù)庫(kù),日本的生物醫(yī)學(xué)領(lǐng)域還是很先進(jìn)的,很多諾貝爾醫(yī)學(xué)獎(jiǎng)得主都是日本人。這個(gè)網(wǎng)站做的很精細(xì),唯一的缺點(diǎn)是數(shù)據(jù)更新沒(méi)有Single Cell Portal和SCXA這兩個(gè)數(shù)據(jù)庫(kù)快。http://single-cell.clst.riken.jp/5.scRNASeqDB:另一大型單細(xì)胞數(shù)據(jù)庫(kù),專門收集人類單細(xì)胞測(cè)序的數(shù)據(jù)庫(kù),涵蓋200種細(xì)胞系和13440個(gè)GSM。除了數(shù)據(jù)龐大的特點(diǎn),這個(gè)數(shù)據(jù)庫(kù)可以進(jìn)行關(guān)鍵基因的在線分析。https://bioinfo.uth.edu/scrnaseqdb/6.Tabula Muris:小鼠的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫(kù),包含了來(lái)自20個(gè)器官和組織的近10萬(wàn)個(gè)細(xì)胞。這些數(shù)據(jù)允許對(duì)組織間共享的細(xì)胞類型的基因表達(dá)進(jìn)行直接和受控的比較,例如來(lái)自不同解剖位置的免疫細(xì)胞。它們還允許對(duì)兩種不同的技術(shù)的單細(xì)胞數(shù)據(jù)進(jìn)行比較:基于微流控液滴的3端測(cè)序:以相對(duì)較低的覆蓋率對(duì)每個(gè)器官的數(shù)千個(gè)細(xì)胞進(jìn)行研究;和基于流式細(xì)胞儀的全長(zhǎng)轉(zhuǎn)錄本分析:提供更高的靈敏度和覆蓋率。https://tabula-muris.ds.czbiohub.org/7.SpatialDB:專門存放單細(xì)胞空間轉(zhuǎn)錄組數(shù)據(jù)的數(shù)據(jù)庫(kù),單細(xì)胞空間轉(zhuǎn)錄組相對(duì)于普通的單細(xì)胞測(cè)序數(shù)據(jù),其保留了樣本的各種細(xì)胞空間分布信息。這個(gè)數(shù)據(jù)庫(kù)可以下載多種疾病模型的單細(xì)胞空間轉(zhuǎn)錄組的數(shù)據(jù)。https://www.spatialomics.org/SpatialDB/8.MCA:浙大郭國(guó)驥老師團(tuán)隊(duì)制作的小鼠單細(xì)胞圖譜數(shù)據(jù)庫(kù),小鼠正常組織的單細(xì)胞數(shù)據(jù)均可在這個(gè)數(shù)據(jù)庫(kù)中下載。http://bis.zju.edu.cn/MCA/ 9.PlantscRNAd:光有動(dòng)物的單細(xì)胞數(shù)據(jù)可不夠,還有做植物研究的小伙伴。但是我們知道植物細(xì)胞有細(xì)胞壁,做植物的單細(xì)胞測(cè)序難度是很高的,于是業(yè)界大佬浙江大學(xué)樊龍江團(tuán)隊(duì)就專門構(gòu)建了植物單細(xì)胞數(shù)據(jù)庫(kù)。http://ibi.zju.edu.cn/plantscrnadb/
二.疾病特異性單細(xì)胞數(shù)據(jù)庫(kù)
1. SC2disease:此數(shù)據(jù)庫(kù)主要用于各類疾病分析,其基于各種疾病和正常單細(xì)胞轉(zhuǎn)錄組基因表達(dá)譜數(shù)據(jù),為研究者提供豐富的細(xì)胞特異性信息,如感興趣基因細(xì)胞特異性表達(dá)情況,特定細(xì)胞類型標(biāo)記,多種疾病生物標(biāo)志物,以及提供在疾病和非疾病狀態(tài)下各種類型細(xì)胞的表達(dá)譜差異性分析功能。http://easybioai.com/sc2disease/2.BloodSpot:健康和血液病單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫(kù),對(duì)于研究血液性疾病的小伙伴,這是一個(gè)寶貴的數(shù)據(jù)庫(kù)。這個(gè)數(shù)據(jù)庫(kù)雖然只收錄了循環(huán)系統(tǒng)的單細(xì)胞數(shù)據(jù),但是功能強(qiáng)大,可使用這個(gè)數(shù)據(jù)庫(kù)進(jìn)行多種在線分析,而且可以將分析結(jié)果以各種圖片的形式導(dǎo)出。http://servers.binf.ku.dk/bloodspot/3. KIT:腎臟單細(xì)胞數(shù)據(jù)庫(kù),收錄了各種腎臟組織的單細(xì)胞數(shù)據(jù),對(duì)腎臟疾病進(jìn)行研究的小伙伴可要將這個(gè)網(wǎng)址記住。
http://humphreyslab.com/SingleCell/4. VascularSingleCell:血管單細(xì)胞數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)收錄了人和小鼠的腦血管肺血管的單細(xì)胞數(shù)據(jù),不同于上面講述的血細(xì)胞數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)只關(guān)注血管細(xì)胞。http://betsholtzlab.org/VascularSingleCells/database.html5. iSyTE:專注于研究眼睛發(fā)育的單細(xì)胞數(shù)據(jù)庫(kù)。https://research.bioinformatics.udel.edu/iSyTE/ppi/index.php6.DBTMEE:專門用于研究眼睛小鼠早期胚胎發(fā)育的單細(xì)胞數(shù)據(jù)庫(kù)。7.CeDR Atlas:CeDR Atlas數(shù)據(jù)庫(kù)基于文獻(xiàn)中人類、小鼠和不同細(xì)胞系的特異性藥物反應(yīng)信息,綜合分析了細(xì)胞類型特異性藥物反應(yīng)分析,涵蓋疾病狀態(tài)下的細(xì)胞類型和正常細(xì)胞類型,為細(xì)胞藥物反應(yīng)譜提供直接參考。數(shù)據(jù)庫(kù)目前收錄超過(guò)582個(gè)人類、小鼠和細(xì)胞系的單細(xì)胞數(shù)據(jù)結(jié)果,包括約140個(gè)表型和1250個(gè)組織/細(xì)胞類型的約188,157個(gè)人類相關(guān)、42660個(gè)小鼠相關(guān)和10299個(gè)細(xì)胞系相關(guān)的細(xì)胞藥物反應(yīng)信息。https://ngdc.cncb.ac.cn/cedr8.Jingle Bells:數(shù)據(jù)來(lái)源為公開(kāi)可用的數(shù)據(jù)(該數(shù)據(jù)庫(kù)只是把公開(kāi)數(shù)據(jù)進(jìn)行了整合) 數(shù)據(jù)來(lái)源相對(duì)集中,收集免疫(120個(gè)數(shù)據(jù)集)以及非免疫(183個(gè)數(shù)據(jù)集)該數(shù)據(jù)庫(kù)作為免疫相關(guān)數(shù)據(jù)的數(shù)據(jù)庫(kù)確實(shí)具有著把相關(guān)信息集中以便我們搜索和學(xué)習(xí)的作用,我們可以通過(guò)這個(gè)數(shù)據(jù)庫(kù)去了解免疫相關(guān)的數(shù)據(jù)以及文獻(xiàn)從而深化我們的課題進(jìn)展http://jinglebells.bgu.ac.il/1.9.Aging Atlas:衰老研究一直都是一個(gè)很熱門的領(lǐng)域,這個(gè)數(shù)據(jù)庫(kù)整理了多項(xiàng)專門研究衰老的單細(xì)胞數(shù)據(jù),可以使用其進(jìn)行衰老相關(guān)基因的研究。https://ngdc.cncb.ac.cn/aging/index10.Gut Cell Atlas:腸道組織的單細(xì)胞測(cè)序數(shù)據(jù)庫(kù),所有單細(xì)胞數(shù)據(jù)均公開(kāi)可下載。https://www.gutcellatlas.org/11.StemMapper:干細(xì)胞發(fā)育研究單細(xì)胞數(shù)據(jù)庫(kù)。http://stemmapper.sysbiolab.eu/12.stemformatics:和StemMapper類似,同樣是針對(duì)干細(xì)胞構(gòu)建的單細(xì)胞數(shù)據(jù)庫(kù)。https://www.stemformatics.org/expressions/gene_expression_graph 三.單細(xì)胞功能分析數(shù)據(jù)庫(kù)
1.HCL:不同于人類圖譜計(jì)劃,這個(gè)數(shù)據(jù)庫(kù)在線分析功能強(qiáng)大。由浙江大學(xué)郭國(guó)驥教授開(kāi)發(fā),包括人類50種組織的超過(guò)70萬(wàn)個(gè)細(xì)胞,劃分為102個(gè)cluster,可以查詢每種組織、每個(gè)cluster的marker基因。可以上傳和下載數(shù)據(jù)自行分析。2.Cell Blast:Cell BLAST是一個(gè)自帶高質(zhì)量參考數(shù)據(jù)庫(kù)的scRNA-seq數(shù)據(jù)檢索/注釋工具,能做細(xì)胞類型鑒定、發(fā)現(xiàn)新細(xì)胞類型、注釋連續(xù)細(xì)胞狀態(tài)。https://cblast.gao-lab.org/3. PanglaoDB:來(lái)自瑞典卡洛琳學(xué)院的研究人員開(kāi)發(fā)的PanglaoDB數(shù)據(jù)庫(kù),用于探索小鼠和人類scRNA-seq數(shù)據(jù),為單細(xì)胞組學(xué)研究提供公共scRNA-seq數(shù)據(jù)資源。相關(guān)研究成果2019年發(fā)表在《Database》。PanglaoDB數(shù)據(jù)庫(kù)收集并整合來(lái)自多個(gè)研究的數(shù)據(jù),包括:小鼠的184種組織、1063個(gè)樣本、446W細(xì)胞;人的74種組織、305個(gè)樣本、112w細(xì)胞。https://panglaodb.se/index.html4.CellMarkrer:該數(shù)據(jù)庫(kù)包括來(lái)源于100000 已發(fā)表文獻(xiàn)整理出來(lái)的,人的158種組織/亞組織、467個(gè)細(xì)胞類型、13605個(gè)Marker基因;小鼠81種組織/亞組織、389個(gè)細(xì)胞類型、9148個(gè)Marker基因。用戶可以通過(guò)選擇物種、組織類型、細(xì)胞類型來(lái)查詢marker基因,也可以下載marker基因列表,還可以上傳自己的文章或數(shù)據(jù)。http://bio-bigdata.hrbmu.edu.cn/CellMarker/5.scQuery:對(duì)比分析不同研究的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)。https://scquery.cs.cmu.edu/6.SCDevDB:?jiǎn)渭?xì)胞深度組學(xué)數(shù)據(jù)庫(kù),在線分析功能強(qiáng)大。https://scdevdb.deepomics.org/7.LnCeCell:從GEO和CancerSEA收集了與癌癥相關(guān)的scRNA-seq數(shù)據(jù)集,確保質(zhì)量,控制癌細(xì)胞數(shù)> 100,并且通過(guò)注釋將表達(dá)譜分為mRNA和lncRNA,使用GENCODE數(shù)據(jù)庫(kù)注釋(GRCh38,版本34)。最后得到源于25種癌癥的40個(gè)單細(xì)胞數(shù)據(jù)集,總共有94605個(gè)單細(xì)胞被用于構(gòu)建LnCeCell。http://www.bio-bigdata.net/LnCeCell/8.ColorCells:這個(gè)數(shù)據(jù)庫(kù)提供了一個(gè)友好的可視化界面,包括PCA和t-SNE算法應(yīng)用于細(xì)胞集群在2d和3d空間中,開(kāi)發(fā)一個(gè)工具來(lái)展示各種組織和細(xì)胞類型在人類和老鼠,建立一個(gè)超幾何分布的統(tǒng)計(jì)檢驗(yàn)方法自動(dòng)分配給細(xì)胞集群,基于SNN和pearson相關(guān)分析,構(gòu)建蛋白- lncrna共表達(dá)網(wǎng)絡(luò),從scRNA-Seq數(shù)據(jù)預(yù)測(cè)lncrna。https://rna.sysu.edu.cn/colorcells/9.Virtual Cytometry:它為使用scRNA-seq數(shù)據(jù)的免疫細(xì)胞分化研究提供計(jì)算平臺(tái),通過(guò)“發(fā)現(xiàn)模塊”和“假設(shè)測(cè)試模塊”分別識(shí)別和驗(yàn)證參與免疫細(xì)胞分化的基因。https://www.grnpedia.org/cytometry/10.SPICA:專注于研究病毒感染和腫瘤小鼠模型的單細(xì)胞數(shù)據(jù)庫(kù)。https://spica.epfl.ch/projects11.GRNdb:轉(zhuǎn)錄因子及其下游靶基因形成的基因調(diào)控網(wǎng)絡(luò)(Gene Regulatory Network, GRN)數(shù)據(jù)庫(kù),是一個(gè)免費(fèi)訪問(wèn)和用戶友好的數(shù)據(jù)庫(kù),可以方便地探索和可視化由轉(zhuǎn)錄因子(轉(zhuǎn)錄因子)和下游靶基因(稱為調(diào)控)形成的預(yù)測(cè)調(diào)控網(wǎng)絡(luò),基于大規(guī)模RNA-seq數(shù)據(jù),以及已知的tf -靶標(biāo)關(guān)系,適用于各種人類和小鼠條件。
12.SciBet:是一種利用單細(xì)胞RNA測(cè)序技術(shù)預(yù)測(cè)任意隨機(jī)測(cè)序細(xì)胞身份的計(jì)算工具。與其他有監(jiān)督的單元類型識(shí)別方法相比,SciBet在精度、魯棒性、可擴(kuò)展性和速度方面都具有優(yōu)勢(shì)。在普通計(jì)算機(jī)上,對(duì)于包含10萬(wàn)個(gè)cell的數(shù)據(jù)集,我們可以在1秒左右完成準(zhǔn)確的特征選擇和分類分析。我們不僅提供了R語(yǔ)言的二進(jìn)制包,還提供了來(lái)自多個(gè)數(shù)據(jù)集的大約100種訓(xùn)練過(guò)的模式。此外,用戶可以在線使用SciBet上傳他們的定制數(shù)據(jù)集進(jìn)行分類。http://scibet.cancer-pku.cn/index.html13.CellPhoneDB:細(xì)胞間通訊網(wǎng)絡(luò)研究的必備研究工具,是由英國(guó)Wellcome Sanger Institute的Teichmann Lab和Vento-Tormo Lab開(kāi)發(fā),但是在線工具不是很穩(wěn)定,需下載自行分析。https://www.cellphonedb.org/14.scMetabolism:收集了KEGG,Reactom中的基因集,可自行上傳數(shù)據(jù),完成對(duì)單細(xì)胞數(shù)據(jù)完成代謝通路的分析。http://www.cancerdiversity.asia/scMetabolism/15.signatureDB: B cell數(shù)據(jù)庫(kù),相應(yīng)成果在2018年發(fā)表在新英格蘭雜志上,數(shù)據(jù)以表格的形式進(jìn)行展示,僅供自行下載研究。https://lymphochip.nih.gov/signaturedb/小編可以負(fù)責(zé)任的和大家講,這是截止到目前,最全面的非腫瘤單細(xì)胞數(shù)據(jù)總結(jié)的推文了。其實(shí)還有一個(gè)數(shù)據(jù)庫(kù)沒(méi)有提及,那就是GEO數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)是很多上述講到的數(shù)據(jù)庫(kù)數(shù)據(jù)的最初來(lái)源,大家也都知道GEO涵蓋了包括bulk, ATAC, Chip等各種數(shù)據(jù),當(dāng)然各大單細(xì)胞研究的數(shù)據(jù)也會(huì)優(yōu)先上傳在這個(gè)數(shù)據(jù)庫(kù)上,小編在這里就不對(duì)其進(jìn)行細(xì)說(shuō)了。各種單細(xì)胞數(shù)據(jù)庫(kù)是非常寶貴的資源,對(duì)已經(jīng)發(fā)表的數(shù)據(jù)進(jìn)行二次分析也逐漸成為一種常態(tài),特別對(duì)一些經(jīng)費(fèi)不足的小課題組,分析已經(jīng)發(fā)表的單細(xì)胞數(shù)據(jù)來(lái)研究自己的科學(xué)問(wèn)題是一項(xiàng)非常具有重大意義的工作。運(yùn)用這些數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘時(shí),首先是去綜合性數(shù)據(jù)庫(kù)下載數(shù)據(jù),因?yàn)檫@些大型數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)的整理相對(duì)規(guī)范;其次針對(duì)自己的研究領(lǐng)域去找疾病特異性的單細(xì)胞數(shù)據(jù)庫(kù);最后是利用可以進(jìn)行在線分析的數(shù)據(jù)庫(kù)對(duì)具體細(xì)胞亞群的功能進(jìn)行研究;最后,希望大家都能利用好這些非腫瘤數(shù)據(jù)庫(kù)資源,早早發(fā)表大paper.
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。