使用 bioMart 包获取数据库信息

使用 bioMart 包获取数据库信息使用 bioMart 包获取数据库信息通过 R 包获取数据库中的信息 该数据库包括一下内容以下内容参考网址 11 查找某个基因在染色体上的位置 反之 给定染色体每一区间 返回该区间的基因 2 通过 EntrezGene 的 ID 查找到相关序列的 GO 注释 反之 给定相关的 GO 注释 获取相关的 EntrezGene 的 ID 3 通过 EntrezGene 的 ID 查找到相关序列的上游 100bp 序列 可能包含启动子等调控元件 4 查找人类染色体上每一段区域中已知的 SNPs 5 给定一组的序列 ID 获得其中具体

使用 bioMart 包获取数据库信息

通过 R 包获取数据库中的信息, 该数据库包括一下内容

以下内容参考网址1

1.查找某个基因在染色体上的位置。反之,给定染色体每一区间,返回该区间的基因;

2.通过EntrezGene的ID查找到相关序列的GO注释。反之,给定相关的GO注释,获取相关的EntrezGene的ID;

3.通过EntrezGene的ID查找到相关序列的上游100bp序列(可能包含启动子等调控元件);

4.查找人类染色体上每一段区域中已知的SNPs;

5.给定一组的序列ID,获得其中具体的序列;

Step.01 Install Package

BiocManager::install("biomaRt") install.packages('curl') 

Step.02 Show Database

library("biomaRt") library('curl') listMarts() 

Step.03 View Abstract

my_mart=useMart('ensembl') dataset = listDatasets(my_mart) grep('mm',dataset[,1],value = T) 

Step.04 Choose species

mart <- useMart("ensembl","hsapiens_gene_ensembl") 人类'hsapiens_gene_ensembl' 小鼠'mmusculus_gene_ensembl' 

Check input types

转换前的ID类型,如:

用listFilters()函数查看可选择的输入类型

Step.05 Use listAttributes check output types

要想知道biomaRt支持哪些ID类型的输出,可以通过以下命令查看,共支持3607种ID输出,这里只截取了一部分输出,一共有name和description两列

listAttributes(mart) 

Step.06 getBM()

hg_symbols<- getBM(attributes=c('ensembl_gene_id','hgnc_symbol',"chromosome_name", "start_position","end_position", "band"), filters= 'ensembl_gene_id', gene = my_ensembl_gene_id, mart = mart) 

这个函数有4个参数

Step.07 Practice

setwd("C:/Users/Desktop/circRNA分析结果/find_circ_result自己分析结果")#设置working directory gene_symbol<-read.csv("SFTSV_24vscontrol_circBase_anno.csv",header=F,stringsAsFactors = F)[,11]#读取数据并提取含有gene_symbol的列 library(biomaRt) mart <- useMart("ensembl","hsapiens_gene_ensembl")小鼠选择mmusculus_gene_ensembl gene_id<-getBM(attributes=c("external_gene_name","ensembl_gene_id"),filters = "external_gene_name",values = gene_symbol, mart = mart)#将输入的filters设置未external_gene_name(也就是gene_symbol),将输出的attributes设置为external_gene_name和emsembl_gene_id write.table(gene_id,"SFTSV_24vscontrol_circBase_anno_gene_id.txt",row.names = F,col.names=F,quote=F) 

  1. https://www.cnblogs.com/yanjiamin/p/12054879.html ↩︎
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/222590.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 下午3:26
下一篇 2026年3月17日 下午3:26


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号