Galaxy 平台下 LEfSe 安装与使用教程[通俗易懂]

Galaxy 平台下 LEfSe 安装与使用教程[通俗易懂]LEfSe(Linea…

大家好,又见面了,我是你们的朋友全栈君。

LEfSe (Linear discriminant analysis Effect Size) 是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker)。

1. 在线安装

Galaxy 中可以使用 admin 账号在 Tool Shed 中直接搜索 lefse,并根据提示一步一步进行安装。本文章的所有截图与操作均来自于 zGalaxy,一个基于 Galaxy release_17.09,部署在阿里云 ECS 经过深度定制的中文版生物信息分析测试平台。6ad44e2e-2303-493e-8c73-07ab279eaef1.png

安装完成的网页界面:b84d6431-4af7-4b97-b6e4-8a995914287c.png

2. 模块依赖

LEfSe 的执行需要解决 R、python 依赖:

  • R libraries: splines, stats4, survival, mvtnorm, modeltools, coin, MASS

  • python libraries: rpy2 (v. 2.1 or higher), numpy, matplotlib (v. 1.0 or higher), argparse

  
  
  
  1. $ cd <GALAXY_ROOT>

  2. $ . .venv/bin/activate

  3. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  4. $ pip install matplotlib==1.5.0

  5. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  6. $ pip install rpy2==2.8.6

matplotlib >= 2.0.0 会导致 LEfSe 的 B)LDAEffectSize(LEfSe) 运行出现 warnning,虽然生成的结果是没问题的。

   
   
   
  1. /data/galaxy-dist/galaxy/.venv/lib/python2.7/site-packages/matplotlib/artist.py:896: MatplotlibDeprecationWarning: The set_axis_bgcolor function was deprecated in version 2.0. Use set_facecolor instead.

  2.  return func(v)

3. 测试与使用

3.1 A) Format Data for LEfSe

第一步,点击 Galaxy 的 “获取数据”“数据上传”“Choose local file”选择本地文件(hmpaerobiosissmall.txt)设置 Type: tabular“start”

  
  
  
  1. wget http://huttenhower.sph.harvard.edu/webfm_send/129 -O hmp_aerobiosis_small.txt

927f2b2a-8831-4568-bd49-d77fe5848da4.png

第二步,点击 Galaxy 中 LEfSe 分析下的 “A) Format Data for LEfSe”,选择第一步输入的数据,设置参数如下。7f45c757-ae17-48ad-aaf7-cdcaea577b2b.png

第三步,点击 “Execute”,提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 “2: A) Format Data for LEfSe on data 1”2bf3a9e2-f633-4f5a-8133-8f34f918a4c9.png

如果 Galaxy 历史栏的结果中出现格式报错:75d56497-cc6d-49e6-9568-c8d143a5f43e.png

这是因为在 Galaxy 中执行 A) Format Data for LEfSe 分析产生的结果默认为 lefse_internal_for 格式,但 Galaxy 本身无法识别该格式。这就需要我们在  config/datatypesconf.xml 中增加 lefseinternal_for 数据格式的登记信息,然后重启 Galaxy 。

   
   
   
  1. <?xml version="1.0"?>

  2. <datatypes>

  3.    <registration>

  4.        ...

  5.        <datatype extension="lefse" type="galaxy.datatypes.data:Lefse" display_in_upload="true"/>

  6.        <datatype extension="lefse_res" type="galaxy.datatypes.tabular:LefseRes" display_in_upload="true"/>

  7.    </registration>

  8. </datatypes>

参考:https://toolshed.g2.bx.psu.edu/repository/viewchangeset?ctxstr=db64b6287cd6&id=cabebb0465f009e4


3.2. B) LDA Effect Size (LEfSe)

第一步,点击 Galaxy 中 LEfSe 分析下的 “B) LDA Effect Size (LEfSe)”,选择 A 的结果数据,设置参数如下。408393dd-7a0c-4f7f-afb5-a6cc8a2b50f2.png

第二步,点击 “Execute”,提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 “3: B) LDA Effect Size (LEfSe) on data 2”ef1de213-e01e-4a69-b701-21bb2b655d8b.png


3.3. C) Plot LEfSe Results

第一步,点击 Galaxy 中 LEfSe 分析下的 “C) Plot LEfSe Results”,选择 B 的结果数据,设置参数如下。a8c7fb20-9830-411b-8076-398ac4373072.png

第二步,点击 “Execute”,提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 “4: C) Plot LEfSe Results on data 3”09db45c5-b3c9-4536-a4e2-736ff5bc2fe5.png


3.4. D) Plot Cladogram

第一步,点击 Galaxy 中 LEfSe 分析下的 “D) Plot Cladogram”,选择 B 的结果数据,设置参数如下。8f49a7e9-0625-4098-8158-06e8d1edce52.png

第二步,点击 “Execute”,提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 “5: D) Plot Cladogram on data 3”d19079ee-75b2-4976-946c-517e76c47389.png


3.5. E) Plot One Feature

第一步,点击 Galaxy 中 LEfSe 分析下的 “E) Plot One Feature”,选择 A 和 B 的结果数据,设置参数如下。a7f36130-a894-425f-83c2-6d2d61fdbc17.png

第二步,点击 “Execute”,提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 “6: E) Plot One Feature on data 3 and data 2”0382b320-0733-4db1-9db8-27c694624308.png


3.6. F) Plot Differential Features

第一步,点击 Galaxy 中 LEfSe 分析下的 “F) Plot Differential Features”,选择 A 和 B 的结果数据,设置参数如下。84dd542f-6c96-4404-8953-5fcdc6f34e4d.png

第二步,点击 “Execute”,提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 “7: F) Plot Differential Features on data 3 and data 2”,点击眼睛图片可以下载本次分析的打包文件(*.zip)。

d1c68c61-e8f7-4af1-b071-8ae45fcbae6c.png

·end·

—如果喜欢,快分享给你的朋友们吧—

我们一起愉快的玩耍吧

本文分享自微信公众号 – 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137543.html原文链接:https://javaforall.net

(1)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Linux学习——shell编程之运算符「建议收藏」

    shell编程之运算符一:shell中常见算术运算符号和优先级二:算术运算符 Shell 变量:是弱类型!不能进行加减乘除!比较麻烦!

    2022年2月26日
    51
  • 电脑蓝屏怎么解决0x0000007b,解决电脑蓝屏问题[通俗易懂]

    电脑蓝屏怎么解决0x0000007b,解决电脑蓝屏问题[通俗易懂]电脑蓝屏代码为0x0000007b到底什么意思呢?0x0000007b算是电脑蓝屏常见故障之一,导致这样情况的原因是什么呢,又要怎么解决,下面看看电脑蓝屏怎么解决0x0000007b.电脑蓝屏代码0x0000007b方法一:更改硬盘模式1,首先我们重启电脑操作,在电脑出现第一界面时快速的按下del键,进入bios界面当中,接着通过键盘上的左右键切换到在“Advanced”选项,进入到下一步。2,在页面中我们找到SATAModeSelection(硬盘模式选择)选项并打开,这时将硬盘模

    2025年8月30日
    7
  • 系统分析师零散知识点「建议收藏」

    系统分析师零散知识点「建议收藏」数据库连接池技术是指在系统初期或者初次使用时,完成数据库的连接,以后不再释放此连接,在处理后面的请求时,反复使用这些已经建立的连接。这种方式可以大大减少数据库的处理时间,有利于提高系统的整体性能、可测量性和扩展性。应用服务器的高速缓存?在应用服务器中有页面的缓存和数据库的缓存。页面的缓存是指将特定的URL对应的页面在缓存中予以记录,以便在

    2022年5月24日
    86
  • 计算机3级数据库技术考哪些内容,计算机考试三级数据库技术考试大纲[通俗易懂]

    计算机3级数据库技术考哪些内容,计算机考试三级数据库技术考试大纲[通俗易懂]全国计算机等级考试采用全国统一命题,统一考试的形式。所有科目每年开考两次。下面是小编整理的计算机考试三级数据库技术考试大纲,欢迎大家参考!基本要求1.掌握数据库技术的基本概念、原理、方法和技术。2.能够使用SQL语言实现数据库操作。3.具备数据库系统安装、配置及数据库管理与维护的基本技能。4.掌握数据库管理与维护的`基本方法。5.掌握数据库性能优化的基本方法。6.了解数据库应用系统的生命周期及其设…

    2022年6月21日
    31
  • 什么是正则化_lo正则化求解方式

    什么是正则化_lo正则化求解方式COUTCutout[1]是一种新的正则化方法。原理是在训练时随机把图片的一部分减掉,这样能提高模型的鲁棒性。它的来源是计算机视觉任务中经常遇到的物体遮挡问题。通过cutout生成一些类似被遮挡的物体,不仅可以让模型在遇到遮挡问题时表现更好,还能让模型在做决定时更多地考虑环境(context)。Theimplementationofcout1.自己码importtorchimpo…

    2025年12月7日
    5
  • acm总结帖_By AekdyCoin

    acm总结帖_By AekdyCoinacm总结帖_ByAekdyCoin各路大牛都在中国大陆的5个赛区结束以后纷纷发出了退役帖,总结帖,或功德圆满,或死不瞑目,而这或许又会造就明年的各种“炸尸”风波。为了考虑在发退役贴以后明年我也成为“僵尸”的可能性,于是改名曰“总结贴”,不提比赛细节,不提比赛流水账,权当是大学本科生涯中acm生活的点滴记录……(1)入门篇甲PS:以下内容…

    2022年7月23日
    18

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号