读懂蛋白质PDB文件

读懂蛋白质PDB文件对于从事生物行业的朋友们来说,PDB文件和蛋白质结构是很多人绕不过去的问题。然而对于天天跑电泳过柱子的生物狗来说,PDB文件打开后与天书无异。这里,我转载一篇网上看到的关于PDB文件内记号说明的文章,希望对大家有用!教你读懂蛋白质的PDB文件&n…

大家好,又见面了,我是你们的朋友全栈君。

对于从事生物行业的朋友们来说,PDB文件和蛋白质结构是很多人绕不过去的问题。然而对于天天跑电泳过柱子的生物狗来说,PDB文件打开后与天书无异。这里,我转载一篇网上看到的关于PDB文件内记号说明的文章,希望对大家有用!

教你读懂蛋白质的PDB文件

   

HETATM 非标准基团原子坐标,这个是PDB数据库原子坐标的一种记录格式。如

HETATM 460 P PO4 100 -2.502 7.587 4.225 1.00 24.59 P
HETATM 461 O1 PO4 100 -3.320 6.532 5.003 1.00 21.58 O
HETATM 462 O2 PO4 100 -2.659 9.016 4.703 1.00 20.93 O
HETATM 463 O3 PO4 100 -1.038 7.162 4.308 1.00 22.74 O
HETATM 464 O4 PO4 100 -3.034 7.618 2.801 1.00 23.47 O 
HETATM 465 O HOH 103 14.704 1.498 15.520 0.80 29.62 O
HETATM 466 O HOH 105 8.954 -3.596 13.444 1.00 28.63 O
HETATM 467 O HOH 108 3.055 0.876 7.712 0.80 16.06 O
HETATM 468 O HOH 110 3.490 -2.454 1.142 0.95 9.35 O

英文在PDB file 中的说明:The HETATM records present the atomic coordinate records for atoms within “non-standard” groups. These records are used for water molecules and atoms presented in HET groups.


附录:PDB数据库原子坐标记录格式

一 标题部分
1 HEADER(分子类,公布日期、ID号)
2 OBSLTE (注明此ID号已改为新号)
3 TITLE(说明实验方法类型)
4 CAVEAT(可能的错误提示)
5 COMPND(化合物分子组成)
6 SOURCE(化合物来源)
7 KEYWDS(关键词)
8 EXPDTA(测定结构所用的实验方法)
9 AUTHOR(结构测定者)
10 REVDAT(修订日期及相关内容)
11 SPRSDE(已撤销或更改的相关记录)
12 JRNL(发表坐标集的文献)
13 REMARK
REMARK 1(有关文献)
REMARK 2(最大分辨率)
REMARK 3(用到的程序和统计方法)
REMARK 4-999
二 一级结构
1 DBREF (其他序列库的有关记录)
2 SEQADV ( PDB与其他记录的出入)
3 SEQRES (残基序列)
4 MODRES (对标准残基的修饰)
三 杂因子
1 HET(非标准残基)
2 HETNAM(非标准残基的名称)
3 HETSNY (非标准残基的同义字)
4 FORMOL(非标准残基的化学式)
四 二级结构
1 HELIX(螺旋)
2 SHEET(折叠片)
3 TURN(转角)
五 连接注释
1 SSBOND(二硫键)
2 LINK(残基间化学键)
3 HYDBND(氢键)
4 SLTBRG(盐桥)
5 CISPEP(顺式残基)
六 晶胞特征及坐标变换
1 CRYST1(晶胞参数)
2 ORIGXn(直角-PDB坐标)
3 SCALEn(直角-部分结晶学坐标)
4 MTRIXn(非晶相对称)
5 TVECT(转换因子)
七 坐标部分
1 MODEL(多亚基时示亚基号)
2 ATOM(标准基团的原子坐标)
3 SIGATM(标准差)
4 ANISOU(温度因子)
5 SIGUIJ(各种温度因素导致的标准差)
6 TER(链末端)
7 HETATM(非标准基团原子坐标)
8 ENDMDL(亚基结束)
八 连通性部分
CONECT(原子间的连通性有关记录)
九 簿记
1 MASTER (版权拥有者)
2 END(文件结束)
 
 
PDB格式文件对大部分做模拟和计算的人来说都很熟悉,但其中各个参数的意义很多人并不是很了解。从网上搜集了一些文章,结合自己的知识来对PDB文件中各个参数的意义做个解释:
REMARK
该记录用来记述结构优化的方法和相关统计数据。如用Refmac进行结构优化,该记录将自动插入输出的PDB。
CRYST1 (NMR除外)
该记录用来记述晶胞结构参数 (a, b, c, α, β, γ, 空间群) 以及 Z值 (单位结构中的聚和链数)。
SCALEn(n = 1, 2, 3) (NMR除外)
该记录介绍数据中直角坐标向部分晶体学坐标的转换。

ATOM
该记录记述了标准氨基酸以及核酸的原子名,残基名,直角坐标,占有率,温度因子等信息。

HETATM
该记录记述了标准氨基酸以及核酸以外的化合物的原子名,残基名,直角坐标,占有率,温度因子等信息。

TER
该记录表示链的末端。在每个聚合链的末端都必须有TER记录,但是由于无序序列而造成的链的中断处不需要该记录。

MODEL
当一个PDB文件中包含多个结构时(例:NMR结构解析),该记录出现在各个模型的第一行。 MODEL记录行的第11-14列上记入模型序号。序号从1开始顺序记入,在11-14列中从右起写。比如说有30个模型,则第1至9号模型,该行的7-13列空白,在14列上记入1-9的数字;第10-30号模型,该行的7-12列空白,13-14列上记入 10-30的数字。
ENDMDL
与MODEL记录成对出现,记述在各模型的链末端的TER记录之后。

END
该记录标志PDB文件的结束,是必需的记录。
B-factoer
The B-factor (or temperature factor) is an indicator of thermal motion about an atom. However, it should be pointed out that the B-factor is a mix of real thermal displacement, static disorder (multiple but defined conformations) and dynamic disorder (no defined
conformation), and all the overlap between these definitions.
是晶体学中的一个重要参数,晶体学中结构因子可以表达为坐标x , y, z与Bj 因子的函数。物理学上对于Bj 的表征有很多理论模型, 最成功的是由Debye 和Waller 提出的. 将固体内振荡的量子本质计算在内后,他们将Bj 表征为绝对温度T 和其他各基本参数的函数。由此可见, Bj 与原子的质量等基本性质有关,也与实验温度有关。
B 因子体现了晶体中原子电子密度的“模糊度”( diffusion) , 这个“模糊度”实际上反映了蛋白质分子在晶体中的构象状态. B 因子越高,“模糊度”越大,相应部位的构象就越不稳定。在晶体学数据中, B 因子一般是以原子为单位给出的,我们可以换算成相应残基的B 因子,从而分析残基的构象稳定性1) . 另外,计算出的B 因子中实际上包含了实验中的很多因素,如晶体结构测定的实验误差等,精度高的晶体结构数据提供较可靠的B 因子数据。
此外,另外温度因子还和占有率相关,如果本身结构解析过程中占有率低,也会导致温度因子升高。这个时候只能说是X-ray收集数据的时候这个地方的信号比较弱,而和结构本身的构象如何,没有关系。
PDB 中的晶体学数据是以原子为单位的,它所给出的B 因子是相对于每个原子的,统计中,首先将原子的B 因子换算成残基的B 因子,即把每个残基所有原子的B 因子取平均值。由于蛋白质分子表面残基的运动性比较大, B 因子相对较高, 所以在统计中除去了这部分残基,具体方法是将数据中B 因子高的残基去掉10 % ,对剩下的残基进行统计,计算平均值。
R-facoter
In overview, the R-factor is a measure of how well a particular model structure fits the observed electron density. Or simply, “a measure of agreement between the crystallographic model and the original X-ray diffraction data”.

转载自:
https://blog.csdn.net/zzwu/article/details/78307351

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137098.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 芯片架构–四大处理器架构「建议收藏」

    芯片架构–四大处理器架构「建议收藏」处理器分为复杂指令集计算机(CISC)和精简指令集计算机(RISC)。1、x86架构我们使用的电脑以及公司的服务器,大部分采用了x86架构的处理器,以intel和AMD的处理器为主。x86架构的处理器采用了CISC指令集(复杂指令集计算机),x86架构的CPU分为x86和x86-64两类,目前主流的是x86-64,即64位的处理器。2、ARM架构我们的手机几乎全部使用了ARM架构,采用了RISC指令集(精简指令集),ARM的优势在于低功耗,因此非常适合手机等终端使用,x86架构的处理器无

    2025年9月28日
    2
  • Pycharm界面的子窗口不见了,怎么办?「建议收藏」

    Pycharm界面的子窗口不见了,怎么办?「建议收藏」Pycharm界面的子窗口不见了 pycharm程序界面一般有很多子窗口,如图1所示。图1 Pycharm子窗口 如果你发现某些子窗口不见了,图2是最过分的情形,无须担心。图2 Pycharm界面的子窗口不见了 打开项目视图子窗口 选择菜单“View>ToolWindows>Project”能够打开左侧的项目视图子窗口。如图4所

    2022年8月26日
    7
  • 【小程序】手把手带你完成微信小程序开发实践

    【小程序】手把手带你完成微信小程序开发实践帐号相关流程注册范围企业政府媒体其他组织换句话讲就是不让个人开发者注册。:)填写企业信息不能使用和之前的公众号账户相同的邮箱,也就是说小程序是和微信公众号一个层级的。填写公司机构信息,对公账户信息绑定管理员微信企业认证公司对公账户对微信进行打款账户自动验证后,自动认证通过,并将认证资金退回公司对公账户,费用在1元内随机小程序发布流程开发实践这次的demo项目为农历和公历的转换器,重在体验

    2022年9月22日
    2
  • restful 幂等性(什么是幂次法则)

    理解RESTful的幂等性,并且设计符合幂等规范的高质量RESTfulAPI。怎么理解幂等性HTTP幂等方法,是指无论调用多少次都不会有不同结果的HTTP方法。不管你调用一次,还是调用一百次,一千次,结果都是相同的。还是以之前的博文的例子为例。【GET】/users#查询用户信息列表【GET】/users/1…

    2022年4月10日
    70
  • PHP怎么获取系统信息和服务器详细信息

    PHP怎么获取系统信息和服务器详细信息

    2021年10月8日
    44
  • 利用泛型抽取Dao层,加事务注解问题(java.lang.Class cannot be cast to java.lang.reflect.ParameterizedType)

    利用泛型抽取Dao层,加事务注解问题(java.lang.Class cannot be cast to java.lang.reflect.ParameterizedType)

    2022年1月20日
    51

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号