blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]

blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数据库(blastx)、蛋白质比对翻译后的核酸数据库(tblastn)、

翻译后的核酸序列比对翻译后的核酸数据库(tblastx)

BLAST+ 链接地址:   ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST

得到最新版本的blast+压缩包:ncbi-blast-2.9.0+-x64-win64.tar.gz

对安装包进行解压:

[wangh@master Softbacks]$ tar -zxvf ncbi-blast-2.9.0+-x64-linux.tar.gz
[wangh@master Softbacks]$ cd ncbi-blast-2.9.0+
[wangh@master ncbi-blast-2.9.0+]$ vim ~/.bashrc # 对blast+进行环境配置,进入变量配置环境中后,按i或者o切换到插入(编辑模式下)输入下列路径
# ncbi-blast
export PATH=/path/ncbi-blast-2.9.0+/bin/:$PATH
#######按Esc键退出编辑环境,再输入 :wq  命令进行写入保存(w)退出(q) 按回车键(Enter)退出
[wangh@master ncbi-blast-2.9.0+]$ source ~/.bashrc #刷新你的环境配置文件,使得系统识别你刚加入的环境变量(也可以关闭当前终端再次打开,系统自动刷新环境配置文件)

 blastp 的用法:

数据库从PDB中下载: ftp://ftp.wwpdb.org/pub/pdb/derived_data/pdb_seqres.txt

用cd-hit处理去冗余(解压后加变量后就能用)

$: cd-hit -i /path/pdb_seqres_simp.fasta -o PDB_simp.fasta -c 0.9

格式化数据库:

$: makeblastdb –in PDB_simp.fasta –dbtype prot –out PDB

-in:待格式化处理的fasta文件(一般是从PDB/NCBI里下载所有的相关或者整个库中的序列);

-dbtype: 数据库类型,prot或者nucl;

-out: 输出的数据库名;
蛋白质比对蛋白数据库(blastp):
blastp –query name.fasta –out name.blast –db PDB –outfmt 6 –evalue 1e-5 –num_threads 11 –max_target_seqs 6

参数说明:

-query: 输入文件路径及文件名(.fasta格式);
-out: 输出文件路径及文件名(.blast);
-db: 格式化了的数据库路径及数据库名(数据库可以从PDB/NCBI里下载所有的相关/整个库中的序列);
-outfmt:输出的文件格式,6是tabular格式对应BLAST的m8格式;
-evalue: 设置输出结果的e-value值;
-max_target_seqs:找到最大的目标的数目,也可以用-num_descriptions,tabular格式输出结果的条数;
-num_threads :线程数,并行运行时,缩短计算时间。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/168185.html原文链接:https://javaforall.net

(0)
上一篇 2022年8月3日 下午4:16
下一篇 2022年8月3日 下午4:36


相关推荐

  • HP电脑win10系统蓝牙不可用解决办法实例[通俗易懂]

    HP电脑win10系统蓝牙不可用解决办法实例[通俗易懂]以win10系统为例子:Cortana里搜蓝牙,打开蓝牙和其他设备设置页面:当时遇到的情况是没有蓝牙那一块儿先检查了蓝牙服务都是正常的:又检查了设备管理器,问题来了,发现没有蓝牙这个项:先用电脑管家一通诊断修复,没用,然后用驱动精灵一通修复诊断还是没用。去网上看了下,说什么的都要,有些说蓝牙硬件坏了,需要重新买个替换掉。但是看…

    2022年8月13日
    10
  • Excel 科学计数法数值转换

    Excel 科学计数法数值转换Excel 科学计数法数值转换 解决数据超过 15 位后面几位变成 0 的问题

    2026年3月16日
    2
  • random.nextint java_实例讲解Java中random.nextInt()与Math.random()的基础用法

    random.nextint java_实例讲解Java中random.nextInt()与Math.random()的基础用法1、来源random.nextInt()为java.util.Random类中的方法;Math.random()为java.lang.Math类中的静态方法。2、用法产生0-n的伪随机数(伪随机数参看最后注解)://两种生成对象方式:带种子和不带种子(两种方式的区别见注解)Randomrandom=newRandom();Integerres=random.nextInt…

    2022年7月22日
    20
  • MySQL常用SQL语句大全

    MySQL常用SQL语句大全MySQL数据库是一个十分轻便的数据库管理系统,相比大型的数据库管理系统如Oracle、MS-SQL,MySQL更拥有轻便、灵活、开发速度快的特色,更适用于中小型数据的存储与架构。MySQL之所以能够被数以万计的网站采用,也是由此而来。

    2022年6月13日
    33
  • Tomcat启动:A fatal error has been detected by the Java Runtime Environment(JVM Crash分析及相关资料)

    Tomcat启动:A fatal error has been detected by the Java Runtime Environment(JVM Crash分析及相关资料)iLife s 博客 http blog csdn net fei 年 1 月 10 号注 今天更新代码之后 突然出现一个问题 Tomcat 启动时 总是会出现 jvmfatalerro 错误导致 tomcat 无法正常启动 以下是错误信息 Afatalerrorh

    2025年7月7日
    4
  • 数据挖掘算法和实际应用案例

    数据挖掘算法和实际应用案例第一次写博客,这次主要引用Little_Rookie大佬的一篇博客,主要来说明一下数据挖掘的主要算法和分类,以及实际生活中的应用案例,同时也是为了方便自己以后的学习。如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都…

    2022年6月16日
    34

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号