Ensembl ID转Gene Symbol

生物信息中Ensembl ID转换为Gene Symbol

TCGA数据库

该方法比较简单,无需安装过多的包,因为安装了几个包显示和R版本不兼容,浪费很多时间,最后用这个包成功将Ensemble转换成ID

R:
#加载org.HS.eg.db
library(org.Hs.eg.db)

#获取所有的ENSEMBL ID 到k中
k=keys(org.Hs.eg.db,keytype = "ENSEMBL")
k

Ensembl ID转Gene Symbol_第1张图片

#找到ENSEMBL ID对应的Gene Symbol与Gene ID(以及Symbol),并查看一下list。
list=select(org.Hs.eg.db,keys=k,columns = c("ENTREZID","SYMBOL"), keytype="ENSEMBL")
View(list)
#数据类型是这样分布的:ENSEMBL ENTREZID SYMBOL

Ensembl ID转Gene Symbol_第2张图片

#将自己需要转换的数据进行转换查找
ID_list=list[match(ID,list[,"ENSEMBL"]),]		#代码中ID换成自己需要转换的Ensembl那一列就可以了
View(ID_list)

#如果查看ID_list为空可以查看一下自己的Ensembl数据是不是带有小数点的类型,如果是则用下面代码删除小数点以及后面的数据,再进行转换
ID <- sub("\\..*", "", ID)    #ID换成自己需要删除小数点的数据列

Ensembl ID转Gene Symbol_第3张图片
链接: 参考了这篇

你可能感兴趣的:(生信小技巧,r语言,数据库)