blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]

blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数据库(blastx)、蛋白质比对翻译后的核酸数据库(tblastn)、

翻译后的核酸序列比对翻译后的核酸数据库(tblastx)

BLAST+ 链接地址:   ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST

得到最新版本的blast+压缩包:ncbi-blast-2.9.0+-x64-win64.tar.gz

对安装包进行解压:

[wangh@master Softbacks]$ tar -zxvf ncbi-blast-2.9.0+-x64-linux.tar.gz
[wangh@master Softbacks]$ cd ncbi-blast-2.9.0+
[wangh@master ncbi-blast-2.9.0+]$ vim ~/.bashrc # 对blast+进行环境配置,进入变量配置环境中后,按i或者o切换到插入(编辑模式下)输入下列路径
# ncbi-blast
export PATH=/path/ncbi-blast-2.9.0+/bin/:$PATH
#######按Esc键退出编辑环境,再输入 :wq  命令进行写入保存(w)退出(q) 按回车键(Enter)退出
[wangh@master ncbi-blast-2.9.0+]$ source ~/.bashrc #刷新你的环境配置文件,使得系统识别你刚加入的环境变量(也可以关闭当前终端再次打开,系统自动刷新环境配置文件)

 blastp 的用法:

数据库从PDB中下载: ftp://ftp.wwpdb.org/pub/pdb/derived_data/pdb_seqres.txt

用cd-hit处理去冗余(解压后加变量后就能用)

$: cd-hit -i /path/pdb_seqres_simp.fasta -o PDB_simp.fasta -c 0.9

格式化数据库:

$: makeblastdb –in PDB_simp.fasta –dbtype prot –out PDB

-in:待格式化处理的fasta文件(一般是从PDB/NCBI里下载所有的相关或者整个库中的序列);

-dbtype: 数据库类型,prot或者nucl;

-out: 输出的数据库名;
蛋白质比对蛋白数据库(blastp):
blastp –query name.fasta –out name.blast –db PDB –outfmt 6 –evalue 1e-5 –num_threads 11 –max_target_seqs 6

参数说明:

-query: 输入文件路径及文件名(.fasta格式);
-out: 输出文件路径及文件名(.blast);
-db: 格式化了的数据库路径及数据库名(数据库可以从PDB/NCBI里下载所有的相关/整个库中的序列);
-outfmt:输出的文件格式,6是tabular格式对应BLAST的m8格式;
-evalue: 设置输出结果的e-value值;
-max_target_seqs:找到最大的目标的数目,也可以用-num_descriptions,tabular格式输出结果的条数;
-num_threads :线程数,并行运行时,缩短计算时间。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/168185.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • java定时任务schedule_timer schedule参数

    java定时任务schedule_timer schedule参数该楼层疑似违规已被系统折叠隐藏此楼查看此楼==============java定时器可以用作,定时刷新缓存等。。。。。。。。。。。timer.schedule(task,firstTime,period);task参数是,TimerTask类,在包:importjava.util.TimerTask.使用者要继承该类,并实现publicvoidrun()方法,因为Tim…

    2022年9月16日
    0
  • 不同浏览器中手动启用Flash Player「建议收藏」

    FlashPlayer用户在浏览网页有时会提示:“AdobeFlashPlayer已被屏蔽”等类似界面,当出现该情况时,那么我们如何手动启用FlashPlayer?我们将这个问题分为以下四种类型进行逐一介绍:谷歌Chrome浏览器1点击chrome浏览器右上角图标2在跳出的对话框中单击设置3在页面底部单击高级4在展开的页面中单击内容设置5单击Flash6打开Flash下方的先询问(推荐)开关7“刷新”视频页面。…

    2022年4月10日
    117
  • 在菜鸟教程学 HTML(一)[通俗易懂]

    在菜鸟教程学 HTML(一)[通俗易懂]注意:对于中文网页需要使用 <metacharset="utf-8"> 声明编码,否则会出现乱码。有些浏览器会设置GBK为默认编码,则你需要设

    2022年8月3日
    4
  • qt的内存映射

    qt的内存映射uchar*QFileDevice::map(qint64offset,qint64size,QFileDevice::MemoryMapFlagsflags=NoOptions)从偏移量开始将文件的大小字节映射到内存中。应该打开一个文件以使映射成功,但在映射内存之后,该文件不需要保持打开状态。当QFile被销毁或用这个对象打开一个新文件时,任何未被映射的映射都将被自动取消映射。映射将具有与文件相同的打开模式(读和/或写),除非使用maprivateOption,在这种情况下,始终可以

    2022年6月15日
    107
  • Oracle中拼接字符串条件查询[通俗易懂]

    Oracle中拼接字符串条件查询[通俗易懂]拼接字符串语法:SELECT*FROMDT_CKTWHEREINSTR(‘192.168.1.137,2.0.1.3’,T.IP)&gt;0;

    2022年9月15日
    0
  • DDR中的ODT功能详解及波形对比[通俗易懂]

    DDR中的ODT功能详解及波形对比[通俗易懂]ODT(ondietermination)即为片内端接,就是将端接电阻放在了芯片内部,这个功能只有在DDR2以上的数据信号才有。而有了ODT功能,原本需要在PCB板上加串联电阻的数据信号就不需要再额外添加端接了,只需要芯片内部打开ODT的端接功能,且这个端接可调。以下就是ODT的端接情况,如图所示:当数据读操作的时候,主控芯片(CPU)读取内存颗粒的数据,此时主控为接收端,可根据需要选择是否打开ODT功能;当数据写操作的时候,主控芯片(CPU)将数据写入内存颗粒,此时颗粒为接收端,也可以根据需要

    2022年9月8日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号