大陆美女视频,最新18韩国美女福利视频,美女视频黄直播

如何把kegg數(shù)據(jù)庫(kù)的hsa系列id轉(zhuǎn)為基因名字呢

2023.04.05 廣東

首先我問(wèn)了一下chatGPT關(guān)于kegg數(shù)據(jù)庫(kù)的hsa系統(tǒng)介紹：

KEGG (Kyoto Encyclopedia of Genes and Genomes) 是一個(gè)集成了基因組、代謝組和信號(hào)傳導(dǎo)通路等多種生物信息學(xué)數(shù)據(jù)和分析工具的綜合性數(shù)據(jù)庫(kù)。KEGG數(shù)據(jù)庫(kù)的hsa系統(tǒng)是其中的一個(gè)分支，專(zhuān)注于人類(lèi)基因組和蛋白質(zhì)組的信息整合、注釋和分析。下面是hsa系統(tǒng)的一些主要特點(diǎn)：

基因信息：hsa系統(tǒng)提供了關(guān)于人類(lèi)基因的詳細(xì)信息，包括基因名稱(chēng)、別名、序列、染色體位置、功能注釋等。這些信息可通過(guò)多種途徑進(jìn)行查詢(xún)和訪問(wèn)，如基因搜索、染色體瀏覽、KEGG PATHWAY等。
代謝通路：hsa系統(tǒng)包含了大量的代謝通路信息，可用于研究代謝通路中基因、蛋白質(zhì)、代謝產(chǎn)物之間的關(guān)系以及代謝通路在生理、疾病等方面的作用。hsa系統(tǒng)中的代謝通路可通過(guò)KEGG PATHWAY進(jìn)行瀏覽和查詢(xún)。
疾病信息：hsa系統(tǒng)還提供了關(guān)于人類(lèi)疾病的信息，包括疾病名稱(chēng)、分類(lèi)、癥狀、基因、代謝通路等方面的信息。這些信息可用于研究基因與疾病之間的關(guān)系，以及發(fā)現(xiàn)潛在的藥物靶點(diǎn)等。
蛋白質(zhì)信息：hsa系統(tǒng)也包含了大量的蛋白質(zhì)信息，包括蛋白質(zhì)名稱(chēng)、序列、功能、亞細(xì)胞定位等。這些信息可用于研究蛋白質(zhì)的結(jié)構(gòu)與功能，以及蛋白質(zhì)在代謝通路中的作用。
工具與資源：除了上述信息之外，hsa系統(tǒng)還提供了一系列的生物信息學(xué)工具和資源，如BLAST搜索、KEGG Mapper、KEGG Orthology等。這些工具和資源可用于研究基因、蛋白質(zhì)和代謝通路等方面的生物學(xué)問(wèn)題。

總之，KEGG數(shù)據(jù)庫(kù)的hsa系統(tǒng)為研究人類(lèi)基因組和蛋白質(zhì)組提供了一個(gè)非常有價(jià)值的資源和工具，廣泛應(yīng)用于生物醫(yī)學(xué)研究、藥物研發(fā)等領(lǐng)域。

目前（2023-04-03）在 https://rest.kegg.jp/list/pathway/hsa 可以看到全部的人類(lèi)的通路，比如：

hsa01100 Metabolic pathways - Homo sapiens (human)
hsa01200 Carbon metabolism - Homo sapiens (human)
hsa01210 2-Oxocarboxylic acid metabolism - Homo sapiens (human)
hsa01212 Fatty acid metabolism - Homo sapiens (human)

目前（2023-04-03）在 https://rest.kegg.jp/link/hsa/pathway 可以看到全部的人類(lèi)的通路以及它對(duì)應(yīng)的基因的hsa系列id，比如：

path:hsa00010 hsa:10327
path:hsa00010 hsa:124
path:hsa00010 hsa:125
path:hsa00010 hsa:126
path:hsa00010 hsa:127

這樣就有一點(diǎn)尷尬，因?yàn)槿祟?lèi)的通路我們可以容忍它是kegg數(shù)據(jù)庫(kù)的id，但是人類(lèi)的基因我們不需要 hsa:127這樣的東西，也很難理解，關(guān)于這些id的定義當(dāng)然了看kegg的官網(wǎng)即可；

比如：https://www.genome.jp/dbget-bin/www_bget?hsa:230 就可以看到這個(gè)基因的很詳細(xì)的信息：

ALDOC, ALDC 
(RefSeq) aldolase, fructose-bisphosphate C

NCBI-GeneID:  230
NCBI-ProteinID:  NP_005156
OMIM:  103870
HGNC:  418
Ensembl:  ENSG00000109107
Pharos:  P09972(Tbio)
UniProt:  P09972 A0A024QZ64

那么就需要一個(gè)轉(zhuǎn)換，如何把kegg數(shù)據(jù)庫(kù)的hsa系列id轉(zhuǎn)為基因名字呢，我繼續(xù)詢(xún)問(wèn)chatGPT，這次它給了我一個(gè)略有瑕疵的代碼：

略有瑕疵的代碼

如果有r基礎(chǔ)，很容易修改成功：

library(KEGGREST)

# example list of hsa IDs
hsa_ids <- c("hsa:10458", "hsa:23545", "hsa:10157")

# retrieve information about the genes
gene_info <- keggGet( hsa_ids  )

# extract the gene names from the information
gene_names <- sapply(gene_info, function(x) x$NAME)

# print the gene names
print(gene_names)

所以，接下來(lái)只需要去 https://rest.kegg.jp/link/hsa/pathway 拿到人類(lèi)的全部的基因的hsa格式的id，然后使用 keggGet 函數(shù)即可批量轉(zhuǎn)換啦。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

打開(kāi)APP，閱讀全文并永久保存查看更多類(lèi)似文章

經(jīng)常提到的KEGG數(shù)據(jù)庫(kù)是什么樣子的

利用KEGG的API獲取基因?qū)?yīng)的pathway 信息

GO 和 KEGG 的區(qū)別 | GO KEGG數(shù)據(jù)庫(kù)用法 | 基因集功能注釋 | 代謝通路富集

wikipathway : 代謝通路專(zhuān)用數(shù)據(jù)庫(kù)

Pathview包：整合表達(dá)譜數(shù)據(jù)可視化KEGG通路

[重磅]KEGG API，你會(huì)用嗎

更多類(lèi)似文章 >>

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看