假设我有一个名为“Tlr6”的基因(见下图),我想知道如何在 R 中检索染色体上该基因的起始值和终止值?例如图中,起始值为64952031,结束值为64960097。
图片网址为here 。
这里的基因名称是 Tlr6
,Ensembl ID 是 ENSMUSG00000051498
。我可以使用这些信息将开始值和结束值读入 R 吗?
最佳答案
您可以使用 Bioconductor
中的 biomaRt
包来执行此操作:
#skip this if the package is already installed
source("http://bioconductor.org/biocLite.R")
biocLite("biomaRt")
library(biomaRt)
#select the ensembl mouse dataset
ensembl <- useMart("ensembl", dataset="mmusculus_gene_ensembl")
getBM(attributes=c("ensembl_gene_id","start_position","end_position"),
filters="ensembl_gene_id",values = "ENSMUSG00000051498",mart=ensembl)
有关该包的更多信息 here 。
关于r - 如何从 Ensembl 检索染色体上基因的起始值和终止值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31680148/