clusterProfiler:构建WikiPathways数据库

WikiPathways是一个开放协作平台,旨在促进生物学界对通路信息的贡献和维护。它提供了一种新的模型,可以增强和补充KEGGReactomePathway Commons等正在进行的工作。

安装相应的R包

初步建立数据库

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
require(rWikiPathways)
wp <- downloadPathwayArchive(organism='Homo sapiens', format='gmt')
text <- readLines(wp, encoding = "UTF-8")
text <- strsplit(text, "\t")
WP <- list(TERM2GENE=data.frame(), TERM2NAME=data.frame())
for (i in 1:length(text)){
line <- text[[i]]
gsid <- line[1]
WP$TERM2NAME <- rbind(WP$TERM2NAME, c(i,gsid))
for(k in 3:length(line)){
WP$TERM2GENE <- rbind(WP$TERM2GENE, c(i,line[k]))
}
}
colnames(WP$TERM2NAME) <- c('gsid', 'name')
colnames(WP$TERM2GENE) <- c('gsid', 'gene')
tmp <- AnnotationDbi::select(org.Hs.eg.db::org.Hs.eg.db,keys=WP$TERM2GENE$gene,columns='SYMBOL', keytype='ENTREZID')

修订部分更新

  • tmp[is.na(tmp$SYMBOL),] 找到所有转换失败的ENTREZID,比如 388813
  • 访问 https://www.ncbi.nlm.nih.gov/gene/ 得到更新信息
  • 比如 388813 现在已经更名为 64092,HGNC确认其官方SYMBOL为 SAMSN1
  • tmp[is.na(tmp$SYMBOL), ‘SYMBOL’] <- c(‘SAMSN1’, rep(‘S1PR3’,3)),手动更新信息
  • WP$TERM2GENE$gene <- tmp$SYMBOL 更改ENTREZID为SYMBOL
  • saveRDS(WP,’WP.hsa.rds’) 保存数据库
  • 自定义数据库的使用方法见下面的博文

https://occdn.limour.top/2128.html


clusterProfiler:构建WikiPathways数据库
https://occdn.limour.top/2130.html
Author
Limour
Posted on
July 21, 2022
Licensed under