Python&R LEfSe 分析

Python&R LEfSe 分析软件安装与路径添加 在涉及到物种或基因组间差异分析的方法中,LEfSe是目前常见的方法。LEfSe实现的方式主要有在线分析和本地分析,在线分析会受到网络及其他因素影响,因而速度可能极慢。本地分析可基于Windows或Linux系统,调参更加灵活。本文以Windows系统为例,向大家展示如何在自己的本本上运行LEfSe,再也不用去求公司了…… 首先,我们要安装好Pyhthon(2.7版本)和R(…

大家好,又见面了,我是你们的朋友全栈君。

软件安装与路径添加

 在涉及到物种或基因组间差异分析的方法中,LEfSe是目前常见的方法。LEfSe实现的方式主要有在线分析和本地分析,在线分析会受到网络及其他因素影响,因而速度可能极慢。本地分析可基于Windows或Linux系统,调参更加灵活。本文以Windows系统为例,向大家展示如何在自己的本本上运行LEfSe,再也不用去求公司了……
 首先,我们要安装好Pyhthon(2.7版本)和R(安装方法不再赘述),然后把软件的安装路径添加到电脑的系统环境变量,如R我是安装在“D:\Rnew\R-3.4.4”,那么我复制这个路径,如下图:
在这里插入图片描述
 然后鼠标右击“我的电脑”→“属性”

在这里插入图片描述
 接下来是“高级系统设置”
在这里插入图片描述
 接下来是双击“环境变量”
在这里插入图片描述
 然后双击“环境变量”,我们会看到两个“Path”。
在这里插入图片描述
 为保证不出意外,我们分别对两个Path进行操作。以上面窗口的Path为例,双击Path,然后“新建”(我的系统为win10,win10以下的系统貌似是直接双击Path就可以操作),然后把R的安装路径粘贴在新建的框内,然后确定,细心的朋友会发现我还把路径“D:\Rnew\R-3.4.4\bin\x64”加入了“环境变量”,是的,我们需要把这两个路径都加入进来。
在这里插入图片描述
 我们检测一下,看R是否成功加入到Path中,我们打开CMD命令行模式,然后输入R→回车键。如下图,说明我们的操作已经成功。
在这里插入图片描述
 接下来是把Python也加进来,操作方法与R一样,
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
 同样的,这里在CMD命令行中输入“python”,然后回车键。如下图,说明python添加到Path成功。
在这里插入图片描述

模块与包的安装

 上述的操作后,我们已经把Python和R成功加入到Path中,在用这两个做数据分析时,我们要安装别人已经写好的模块与包(packages)。LEfSe主要以Python运行为主,但要调用到R的几个packages。首先,对于python,我们需要安装“numpy”、“rpy2”与“matplotlib”三个模块,在R中需要安装好几个packages,如mvtnorm、coin等。我们先安装Python的模块,在数据分析过程中提示未找到“packages”时,我们再用R安装对应的packages。下面以numpy模块安装为例:在CMD命令行中运行:

pip install D:\python\numpy-1.14.1-cp27-none-win_amd64.whl

等待安装完毕,这里可以分别打开3个CMD,分别安装“numpy”、“rpy2”与“matplotlib”(对于模块的安装,我这里是把模块下载到电脑上,也可以联网安装,农村不仅路滑,网也不好,所以下载→本地安装)。

在这里插入图片描述
 模块安装好后,我们在CMD命令行中输入python,然后回车键,然后输入:

import numpy

回车键。如下图,说明numpy被成功安装,切记还有rpy2与matplotlib也要安装!
在这里插入图片描述

这一步非常重要,我们打开系统环境变量,然后”新建”,变量名为“R_USER”,变量值为某一个路径即可,然后“确定”

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
 至此,准备就绪,我们需要去下载LEfSe分析的代码:https://bitbucket.org/nsegata/metaphlan/wiki/MetaPhlAn_Pipelines_Tutorial

在这里插入图片描述
然后解压如下图的代码:

在这里插入图片描述
得到如下文件:
在这里插入图片描述
 到这里前期工作准备得差不多了,我们需要对物种或者基因的数据进行格式整理:第一列为物种名字,第一行为样本重复(切记要灵活运用、操作):

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

开始做分析

 打开CMD,把运行路径切换到待分析数据所在路径:我的数据在“D:\yingyong”,

D:
cd D:\yingyong

具体操作如下图。
在这里插入图片描述
 代码路径为“D:\lefse”,第一步:

D:\lefse\format_input.py hh.txt lefse.in.txt -c 1 -o 100000

在这里插入图片描述
 第二步:

D:\lefse\run_lefse.py lefse.in.txt lefse.out.txt -l 3

在这里插入图片描述
 第三步:开始画图,

D:\lefse\plot_res.py lefse.out.txt lda.pdf --format pdf

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
 第四步:还是图,

D:\lefse\plot_cladogram.py lefse.out.txt yuan.pdf --format pdf --labeled_start_lev 1

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
 那么,LEfSe分析的常见图已经出来,对于biomarker在每个组中的相对丰度,这里不再演示,算是留个悬念,有需要的朋友可以自行探索或加入文后的QQ群→讨论。
 对于上面的图,我们会发现物种名没有完全显示,这里我们推荐用AI软件(Adobe Illustrator)进行调整(是调整,不是修改!),对于LEfSe分析操作,需要自己灵活操作,照猫画虎绝对是不行的。对于图的解读可以参考已经发表的诸多papers。为加快初学者分析数据、绘图的速度,我们创建了一个QQ群:335774366。欢迎有兴趣的朋友加入→指导。
 2019年了,祝各位朋友:“猪”事顺利→做一只特立独行的猪?。
声明:以上内容仅为作者个人理解,有不对的地方,欢迎指正。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131286.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月29日 下午6:00
下一篇 2022年4月29日 下午6:00


相关推荐

  • 如何本地化部署豆包大模型

    如何本地化部署豆包大模型

    2026年3月12日
    2
  • Linux系统安装Python3环境(超详细)

    Linux系统安装Python3环境(超详细)本文基于如下Linux系统版本:1、默认情况下,Linux会自带安装Python,可以运行python–version命令查看,如图:我们看到Linux中已经自带了Python2.7.5。再次运行python命令后就可以使用python命令窗口了(Ctrl+D退出python命令窗口)。2、查看Linux默认安装的Python位置看到/usr/bin/python…

    2022年5月26日
    65
  • JS : clearInterval()失效,无法暂停setInterval()的原因[通俗易懂]

    JS : clearInterval()失效,无法暂停setInterval()的原因[通俗易懂]环境:我在函数A调用函数B,函数B里写了setInterval()。原因:页面加载时我调用了2次函数A,导致调用了2次setInterval(),导致有setInterval_id有2个值。clearInterval()只关闭了其中一个setInterval_id,另一个setInterval_id还会启动setInterval()。改为只调用一次函数A即可。…

    2025年7月13日
    5
  • CAP理论应用

    CAP理论应用神一样的CAP理论被应用在何方对于开发或设计分布式系统的架构师工程师来说,CAP是必须要掌握的理论。(but:这个文章的重点并不是讨论CAP理论和细节,重点是说说CAP在微服务中的开发怎么起到一个指引作用,会通过几个微服务开发的例子说说明,尽量的去贴近开发)CAP定理又被成为布鲁尔定理,是加州大学计算机科学家埃里克·布鲁尔提出来的猜想,后来被证明成为分布式计算领域公认的定理。不过布…

    2022年6月26日
    30
  • 如何利用计算机伪概率,伪随机数

    如何利用计算机伪概率,伪随机数伪随机数是用确定性的算法计算出来自 0 1 均匀分布的随机数序列 并不真正的随机 但具有类似于随机数的统计特征 如均匀性 独立性等 在计算伪随机数时 若使用的初值 种子 不变 那么伪随机数的数序也不变 伪随机数可以用计算机大量生成 在模拟研究中为了提高模拟效率 一般采用伪随机数代替真正的随机数 模拟中使用的一般是循环周期极长并能通过随机数检验的伪随机数 以保证计算结果的随机性 1 中文名伪随机数

    2026年3月19日
    2
  • 如何给mysql的海量数据查询优化

    如何给mysql的海量数据查询优化公司订单系统每日订单量庞大 有很多表数据超千万 公司 SQL 优化这块做的很不好 可以说是没有做 所以导致查询很慢 nbsp 正题 节选某个功能中的一句 SQL nbsp EXPLAIN nbsp 查看执行计划 EXPLAIN SQL 查看 SQL 执行计划 一个索引没用到 受影响行接近 2000 万 难怪会慢 nbsp 原来的 SQL 打印出来估计有好几张 A4 纸 我发个整理后的简版

    2026年3月18日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号