golang 数据库开发(golang append)

前言:微博参与话题#给你四年时间你也学不会生信#先前的富集分析教程本文主要针对非模式物种,但是有参考基因组可用1.R包安装及database下载#non-model,buthavethegenome>source(“https://bioconductor.org/biocLite.R”)>biocLite(“AnnotationHub”)>biocLite(…

大家好,又见面了,我是你们的朋友全栈君。

前言:

微博参与话题 #给你四年时间你也学不会生信#

先前的富集分析教程

本文主要针对非模式物种,但是有参考基因组可用

1. R包安装及database下载

# non-model, but have the genome

> source(“https://bioconductor.org/biocLite.R”)

> biocLite(“AnnotationHub”)

> biocLite(“biomaRt”)

# load package

> library(AnnotationHub)

> library(biomaRt)

# make a orgDb

> hub

这里以桔小实蝇为例

# fruit fly = bactrocera dorsalis

> query(hub, “bactrocera”)

搜索后结果如下:

> query(hub, “bactrocera”)

AnnotationHub with 9 records

# snapshotDate(): 2018-04-30

# $dataprovider: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/

# $species: Bactrocera (Bactrocera)_dorsalis, Bactrocera (Bactrocera)_latifrons, Bactrocera (Dacul…

# $rdataclass: OrgDb

# additional mcols(): taxonomyid, genome, description, coordinate_1_based, maintainer,

# rdatadateadded, preparerclass, tags, rdatapath, sourceurl, sourcetype

# retrieve records with, e.g., ‘object[[“AH62538”]]’

title

AH62538 | org.Bactrocera_(Bactrocera)_latifrons.eg.sqlite

AH62539 | org.Bactrocera_latifrons.eg.sqlite

AH62542 | org.Bactrocera_(Daculus)_oleae.eg.sqlite

AH62543 | org.Bactrocera_(Dacus)_oleae.eg.sqlite

AH62544 | org.Bactrocera_oleae.eg.sqlite

AH62568 | org.Bactrocera_(Zeugodacus)_cucurbitae.eg.sqlite

AH62569 | org.Bactrocera_cucurbitae.eg.sqlite

AH62581 | org.Bactrocera_(Bactrocera)_dorsalis.eg.sqlite

AH62582 | org.Bactrocera_dorsalis.eg.sqlite

我们选择AH62582 | org.Bactrocera_dorsalis.eg.sqlite并下载它

> Bactrocera.OrgDb

如果报错,可能是缺少依赖的安装包,可以按照提示依次下载,两种方法

install.packages(“packages”)

2. 查看注释信息

> columns(Bactrocera.OrgDb)

[1] “ACCNUM” “ALIAS” “CHR” “ENTREZID” “EVIDENCE” “EVIDENCEALL” “GENENAME”

[8] “GID” “GO” “GOALL” “ONTOLOGY” “ONTOLOGYALL” “PMID” “REFSEQ”

[15] “SYMBOL”

> Bactrocera.OrgDb

OrgDb object:

| DBSCHEMAVERSION: 2.1

| DBSCHEMA: NOSCHEMA_DB

| ORGANISM: Bactrocera dorsalis

| SPECIES: Bactrocera dorsalis

| CENTRALID: GID

| Taxonomy ID: 27457

| Db type: OrgDb

| Supporting package: AnnotationDbi

Please see: help(‘select’) for usage information

# 查看注释信息的每一列

> head(keys(Bactrocera.OrgDb,keytype = “ALIAS”))

[1] “AAA62341.1” “AAA62342.1” “AAA62343.1” “AAA62344.1” “AAF22478.1” “AAL17758.1”

实际上,ALIAS内包含了“omitted 17518 entries”

3. GO富集分析

# 对BP(Biological process)进行富集分析

# 只需将OrgDb数据库替换为我们下载好的非模式物种库即可。

> enrich.go.BP = enrichGO(gene = DEG.gene_symbol,

OrgDb = Bactrocera.OrgDb,

keyType = ‘ENTREZID’,ont= “BP”,

pvalueCutoff = 0.01,

qvalueCutoff = 0.05,

readable = T)

> barplot(enrich.go.BP)

> dotplot(enrich.go.BP)

p_value: 富集显著性,统计显著性要去小于0.01;

q_value: 对p_value的修正,在多次统计检验时,需要有修正值;

q_value一定大于p_value

4. KEGG富集分析

# 只需将OrgDb数据库替换为我们下载好的非模式物种库即可。

> enrichKEGG(gene = DEG.gene_symbol,

OrgDb = Bactrocera.OrgDb,

keyType = ‘ENTREZID’,

ont = “DO”,

pvalueCutoff = 0.01,

qvalueCutofF = 0.05,

readable = T)

5. GO出图解读

纵轴为GO中每一term,例如Legionellosis;

横轴为GeneRatio,即输入的基因,term在整体基因中所占的百分数;

圆圈大小表示count的数目;

p.adjust:p越小,圆越大,结果越可靠;

c1348043c093

Rplot22.png

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/129734.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Python网络爬虫精要

    Python网络爬虫精要

    2021年11月8日
    40
  • iOS逆向入门实践 — 逆向微信,伪装定位(二)

    iOS逆向入门实践 — 逆向微信,伪装定位(二)1.创建工程还是跟之前的步骤一致,创建工程,然后配置Makefile。注意创建工程时名字只能包含数字跟字母。Makefile上面引入的 FakeWeChatLocationManager.m 文件是主要代码实现的地方,分离出来好模块化。2.Reveal注入为了更好地定位代码,需要分析一下“附近的人”这个界面对应的类名是什么,然后进一步分析

    2022年6月2日
    42
  • 【Maven学习】Maven打包生成包含所有依赖的jar包

    【Maven学习】Maven打包生成包含所有依赖的jar包maven打包生成的普通jar包,只包含该工程下源码编译结果,不包含依赖内容。同时,maven提供以下方式生成包含所有依赖的jar文件,依赖以class的方式存在;将此plugin添加到pom文件中maven-assembly-plugin

    2022年5月29日
    110
  • 关于在phpStudy环境下,windows cmd中 php不是内部命令问题

    关于在phpStudy环境下,windows cmd中 php不是内部命令问题

    2021年10月29日
    43
  • 深度学习中的自动编码器:TensorFlow示例

    深度学习中的自动编码器:TensorFlow示例什么是自动编码器?  自动编码器是重建输入的绝佳工具。简单来说,机器就是一个图像,可以生成一个密切相关的图片。这种神经网络中的输入是未标记的,这意味着网络能够在没有监督的情况下进行学习。更准确地说,输入由网络编码,仅关注最关键的特征。这是自动编码器因降维而流行的原因之一。此外,自动编码器可用于生成生成学习模型。例如,神经网络可以用一组面部训练,然后可以产生新的面部。Autoencoder如何工…

    2022年6月3日
    43
  • Cpu流水线_cpu多级流水线

    Cpu流水线_cpu多级流水线原文地址:AJourneyThroughtheCPUPipeline转载翻译地址:CPU流水线的探秘之旅作为程序员,CPU在我们的工作中扮演了核心角色,因此了解处理器内部的工作方式对程序员来说不无裨益。CPU是如何工作的呢?一条指令执行需要多长时间?当我们讨论某个新款处理器拥有12级流水线还是18级流水线,甚至是更深的31级流水线时,这到些都意味着什么呢?应用程序通常会将CPU看

    2022年8月20日
    9

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号