blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]

blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数据库(blastx)、蛋白质比对翻译后的核酸数据库(tblastn)、

翻译后的核酸序列比对翻译后的核酸数据库(tblastx)

BLAST+ 链接地址:   ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST

得到最新版本的blast+压缩包:ncbi-blast-2.9.0+-x64-win64.tar.gz

对安装包进行解压:

[wangh@master Softbacks]$ tar -zxvf ncbi-blast-2.9.0+-x64-linux.tar.gz
[wangh@master Softbacks]$ cd ncbi-blast-2.9.0+
[wangh@master ncbi-blast-2.9.0+]$ vim ~/.bashrc # 对blast+进行环境配置,进入变量配置环境中后,按i或者o切换到插入(编辑模式下)输入下列路径
# ncbi-blast
export PATH=/path/ncbi-blast-2.9.0+/bin/:$PATH
#######按Esc键退出编辑环境,再输入 :wq  命令进行写入保存(w)退出(q) 按回车键(Enter)退出
[wangh@master ncbi-blast-2.9.0+]$ source ~/.bashrc #刷新你的环境配置文件,使得系统识别你刚加入的环境变量(也可以关闭当前终端再次打开,系统自动刷新环境配置文件)

 blastp 的用法:

数据库从PDB中下载: ftp://ftp.wwpdb.org/pub/pdb/derived_data/pdb_seqres.txt

用cd-hit处理去冗余(解压后加变量后就能用)

$: cd-hit -i /path/pdb_seqres_simp.fasta -o PDB_simp.fasta -c 0.9

格式化数据库:

$: makeblastdb –in PDB_simp.fasta –dbtype prot –out PDB

-in:待格式化处理的fasta文件(一般是从PDB/NCBI里下载所有的相关或者整个库中的序列);

-dbtype: 数据库类型,prot或者nucl;

-out: 输出的数据库名;
蛋白质比对蛋白数据库(blastp):
blastp –query name.fasta –out name.blast –db PDB –outfmt 6 –evalue 1e-5 –num_threads 11 –max_target_seqs 6

参数说明:

-query: 输入文件路径及文件名(.fasta格式);
-out: 输出文件路径及文件名(.blast);
-db: 格式化了的数据库路径及数据库名(数据库可以从PDB/NCBI里下载所有的相关/整个库中的序列);
-outfmt:输出的文件格式,6是tabular格式对应BLAST的m8格式;
-evalue: 设置输出结果的e-value值;
-max_target_seqs:找到最大的目标的数目,也可以用-num_descriptions,tabular格式输出结果的条数;
-num_threads :线程数,并行运行时,缩短计算时间。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/168185.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Flash cookie — 本地共享对象(LOCAL SHARED OBJECTS)

    Flash cookie — 本地共享对象(LOCAL SHARED OBJECTS)写道本地共享对象(有时也称为“Flashcookie”)是一些可由您访问的站点在您的计算机上创建的数据文件。共享对象大多数情况下用来增强您浏览Web的体验。网站可以在您的计算机上编写cookie,当您下次访问该网站时,它将加载该cookie及其信息,从而使您拥有一种更加个性化的体验。例如,您可能让站点记住您的登录名。该信息存储在cookie中,并在您下次访问时被检索…

    2022年7月15日
    11
  • Android下基于Iptables的一种app网络访问控制方案(二)

    Android下基于Iptables的一种app网络访问控制方案(二)3.如何在Android系统中集成?以上通过adb shell命令行在Android设备上将方案调通之后,接下来考虑如何集成在Android系统中。作为一个整体解决方案,需要至少解决两部分功能:(1)网络访问规则。包括规则定义、存储、对外接口、对内转化成Iptables命令。(2)Iptables命令执行。第一部分比较简单,在此不详述。主要看第二部分。对于某一个垂直功能,And

    2022年7月23日
    5
  • Ajax技术的优缺点[通俗易懂]

    Ajax技术的优缺点[通俗易懂]1. 什么是ajax,为什么要使用Ajax(请谈一下你对Ajax的认识)什么是ajax:AJAX是“AsynchronousJavaScriptandXML”的缩写。他是指一种创建交互式网页应用的网页开发技术。Ajax包含下列技术:基于web标准(standards-basedpresentation)XHTML+CSS的表示;使用DOM(Docu

    2025年6月1日
    2
  • idea 正则表达式替换「建议收藏」

    idea 正则表达式替换「建议收藏」例如,现在有一个函数getView(o,’m’,’orderNum’,’s’),这个函数的调用有很多地方,有一天我们想给这个函数加一个默认参数,让它变成getView(o,’m’,’orderNum’,’s’,’*’),一个一个加太麻烦了,我们就用idea自带的正则表达式替换功能来实现。首先按Ctrl+R,打开替换对话框,然后在上面输入getView\((.+)\),下面输…

    2022年5月17日
    318
  • SQL 获取当前系统时间

    SQL 获取当前系统时间SQL获取当前系统时间

    2022年10月19日
    2
  • 使用多线程实现文件的下载_多线程写同一个文件

    使用多线程实现文件的下载_多线程写同一个文件首先,我们要下载一个文件,可以通过多线程的方式快速下载!!!多线程下载文件的步骤:1、首先要知道请求下载的服务器支持断点下载,即支持request头信息中的Range的设置2、然后通过对请求头设置httpRequest.setRequestProperty(“Range”,”bytes=”+startIndex+”-“+endIndex);3、然后获取整个文件的大小4、在……

    2025年10月21日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号