教你读懂蛋白质数据库文件(PDB文件)

教你读懂蛋白质数据库文件(PDB文件)回答网友提问:什么是HETATM?  并教你读懂蛋白质的PDB文件  作者:小米HETATM非标准基团原子坐标,这个是PDB数据库原子坐标的一种记录格式。如HETATM460PPO4100-2.5027.5874.2251.0024.59PHETATM461O1PO4100-3.3206.5325.0031.00

大家好,又见面了,我是你们的朋友全栈君。

回答网友提问:什么是HETATM?

   

并教你读懂蛋白质的PDB文件

   

作者:小米

HETATM 非标准基团原子坐标,这个是PDB数据库原子坐标的一种记录格式。如

HETATM 460 P PO4 100 -2.502 7.587 4.225 1.00 24.59 P

HETATM 461 O1 PO4 100 -3.320 6.532 5.003 1.00 21.58 O

HETATM 462 O2 PO4 100 -2.659 9.016 4.703 1.00 20.93 O

HETATM 463 O3 PO4 100 -1.038 7.162 4.308 1.00 22.74 O

HETATM 464 O4 PO4 100 -3.034 7.618 2.801 1.00 23.47 O 

HETATM 465 O HOH 103 14.704 1.498 15.520 0.80 29.62 O

HETATM 466 O HOH 105 8.954 -3.596 13.444 1.00 28.63 O

HETATM 467 O HOH 108 3.055 0.876 7.712 0.80 16.06 O

HETATM 468 O HOH 110 3.490 -2.454 1.142 0.95 9.35 O

英文在PDB file 中的说明:The HETATM records present the atomic coordinate records for atoms within “non-standard” groups. These records are used for water molecules and atoms presented in HET groups.


附录:PDB数据库原子坐标记录格式

一 标题部分

1 HEADER(分子类,公布日期、ID号)

2 OBSLTE (注明此ID号已改为新号)

3 TITLE(说明实验方法类型)

4 CAVEAT(可能的错误提示)

5 COMPND(化合物分子组成)

6 SOURCE(化合物来源)

7 KEYWDS(关键词)

8 EXPDTA(测定结构所用的实验方法)

9 AUTHOR(结构测定者)

10 REVDAT(修订日期及相关内容)

11 SPRSDE(已撤销或更改的相关记录)

12 JRNL(发表坐标集的文献)

13 REMARK

REMARK 1(有关文献)

REMARK 2(最大分辨率)

REMARK 3(用到的程序和统计方法)

REMARK 4-999

二 一级结构

1 DBREF (其他序列库的有关记录)

2 SEQADV ( PDB与其他记录的出入)

3 SEQRES (残基序列)

4 MODRES (对标准残基的修饰)

三 杂因子

1 HET(非标准残基)

2 HETNAM(非标准残基的名称)

3 HETSNY (非标准残基的同义字)

4 FORMOL(非标准残基的化学式)

四 二级结构

1 HELIX(螺旋)

2 SHEET(折叠片)

3 TURN(转角)

五 连接注释

1 SSBOND(二硫键)

2 LINK(残基间化学键)

3 HYDBND(氢键)

4 SLTBRG(盐桥)

5 CISPEP(顺式残基)

六 晶胞特征及坐标变换

1 CRYST1(晶胞参数)

2 ORIGXn(直角-PDB坐标)

3 SCALEn(直角-部分结晶学坐标)

4 MTRIXn(非晶相对称)

5 TVECT(转换因子)

七 坐标部分

1 MODEL(多亚基时示亚基号)

2 ATOM(标准基团的原子坐标)

3 SIGATM(标准差)

4 ANISOU(温度因子)

5 SIGUIJ(各种温度因素导致的标准差)

6 TER(链末端)

7 HETATM(非标准基团原子坐标)

8 ENDMDL(亚基结束)

八 连通性部分

CONECT(原子间的连通性有关记录)

九 簿记

1 MASTER (版权拥有者)

2 END(文件结束)

 

 

 

 

 

 

 

 

PDB格式文件对大部分做模拟和计算的人来说都很熟悉,但其中各个参数的意义很多人并不是很了解。从网上搜集了一些文章,结合自己的知识来对PDB文件中各个参数的意义做个解释:

REMARK

该记录用来记述结构优化的方法和相关统计数据。如用Refmac进行结构优化,该记录将自动插入输出的PDB。

CRYST1 (NMR除外)

该记录用来记述晶胞结构参数 (a, b, c, α, β, γ, 空间群) 以及 Z值 (单位结构中的聚和链数)。

SCALEn(n = 1, 2, 3) (NMR除外)

该记录介绍数据中直角坐标向部分晶体学坐标的转换。

ATOM

该记录记述了标准氨基酸以及核酸的原子名,残基名,直角坐标,占有率,温度因子等信息。

HETATM

该记录记述了标准氨基酸以及核酸以外的化合物的原子名,残基名,直角坐标,占有率,温度因子等信息。

TER

该记录表示链的末端。在每个聚合链的末端都必须有TER记录,但是由于无序序列而造成的链的中断处不需要该记录。

MODEL

当一个PDB文件中包含多个结构时(例:NMR结构解析),该记录出现在各个模型的第一行。 MODEL记录行的第11-14列上记入模型序号。序号从1开始顺序记入,在11-14列中从右起写。比如说有30个模型,则第1至9号模型,该行的7-13列空白,在14列上记入1-9的数字;第10-30号模型,该行的7-12列空白,13-14列上记入 10-30的数字。

ENDMDL

与MODEL记录成对出现,记述在各模型的链末端的TER记录之后。

END

该记录标志PDB文件的结束,是必需的记录。

B-factoer

The B-factor (or temperature factor) is an indicator of thermal motion about an atom. However, it should be pointed out that the B-factor is a mix of real thermal displacement, static disorder (multiple but defined conformations) and dynamic disorder (no defined conformation), and all the overlap between these definitions.

是晶体学中的一个重要参数,晶体学中结构因子可以表达为坐标x , y, z与Bj 因子的函数。物理学上对于Bj 的表征有很多理论模型, 最成功的是由Debye 和Waller 提出的. 将固体内振荡的量子本质计算在内后,他们将Bj 表征为绝对温度T 和其他各基本参数的函数。由此可见, Bj 与原子的质量等基本性质有关,也与实验温度有关。

B 因子体现了晶体中原子电子密度的“模糊度”( diffusion) , 这个“模糊度”实际上反映了蛋白质分子在晶体中的构象状态. B 因子越高,“模糊度”越大,相应部位的构象就越不稳定。在晶体学数据中, B 因子一般是以原子为单位给出的,我们可以换算成相应残基的B 因子,从而分析残基的构象稳定性1) . 另外,计算出的B 因子中实际上包含了实验中的很多因素,如晶体结构测定的实验误差等,精度高的晶体结构数据提供较可靠的B 因子数据。

此外,另外温度因子还和占有率相关,如果本身结构解析过程中占有率低,也会导致温度因子升高。这个时候只能说是X-ray收集数据的时候这个地方的信号比较弱,而和结构本身的构象如何,没有关系。

PDB 中的晶体学数据是以原子为单位的,它所给出的B 因子是相对于每个原子的,统计中,首先将原子的B 因子换算成残基的B 因子,即把每个残基所有原子的B 因子取平均值。由于蛋白质分子表面残基的运动性比较大, B 因子相对较高, 所以在统计中除去了这部分残基,具体方法是将数据中B 因子高的残基去掉10 % ,对剩下的残基进行统计,计算平均值。

R-facoter

In overview, the R-factor is a measure of how well a particular model structure fits the observed electron density. Or simply, “a measure of agreement between the crystallographic model and the original X-ray diffraction data”.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137132.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月2日 下午2:46
下一篇 2022年6月2日 下午2:46


相关推荐

  • 散列表采用线性探测法会出现_平方探测法解决冲突

    散列表采用线性探测法会出现_平方探测法解决冲突第一、前言ThreadLocal使用的是自定义的ThreadLocalMap,接下来我们来探究一下ThreadLocalMap的hash冲突解决方式。第二、ThreadLocal的set()方法publicvoidset(Tvalue){Threadt=Thread.currentThread();ThreadLocal.ThreadLocalMapmap=getMap(t);if(map!=null)map.set(this,

    2022年10月21日
    3
  • Pycharm git 使用简介

    Pycharm git 使用简介1.VCS版本控制服务器(GITCVSSVN)2.VCS—>checkoutfromversioncontrol从服务器clone代码并且创建本地项目,默认切换到主分支(master)3.gitignore文件:用来添加忽略文件4.右键—>Git—>Repository—>Branches创建并切换到dev分支5.开发到一定阶段将dev分支…

    2025年8月1日
    6
  • Android ActivityManager一些API介绍

    Android ActivityManager一些API介绍Android 中 Java 层的 ActivityMana 类中封装了很多 API 可以供我们查询当前系统的很多信息 包括 内存 进程 Process 任务栈 Task 服务 Service 等的相关信息 利用这些信息可以进行一些有用的判断 例如判断当前系统内存是否不足 指定 Service 是否在运行中 ActivityMana 类封装了很多 API 方法供上层调用 具体负责管理 Activity Service 等组件的是 ActivityMana AMS

    2026年3月18日
    1
  • Zulu智能体

    Zulu智能体

    2026年3月16日
    9
  • sklearn安装教程_sklearn库的使用

    sklearn安装教程_sklearn库的使用Sklearn(全称Scikit-Learn)是基于Python语言的机器学习工具,是机器学习中的常用第三方模块。它建立在NumPy,SciPy和Matplotlib之上。因此,在安装sklearn之前,需要先安装其三个依赖库numpy+scipy+matplotlib,具体安装步骤如下:1.进入官网下载相应的模块安装地址如下https://www.lfd.uci.edu/~gohlke/pythonlibs网站中包含了python中所需的子库。进去之后查找比较麻烦,可以在网址后

    2022年10月18日
    6
  • Python get-pip.py文件

    Python get-pip.py文件Pythonget pip py 文件做项目时发现 get pip py 这个文件比较难下载 将此文件分享给各位需要的人 文件来源 https bootstrap pypa io get pip py 如果链接打不开请至网盘自行下载 链接 https pan baidu com s 13rIiIcpaQpO 提取码 r2mb

    2026年3月18日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号