gff文件_GFF文件格式简介

gff文件_GFF文件格式简介鉴于代码的排版问题 建议在电脑上阅读本文 组装得到基因组的序列只是开展基因组研究的第一步 基因的结构是基因组后续功能研究的基石 在 NCBI 中 除了提供基因组序列外 还提供了基因结构的信息 采用的就是 GFF 格式 human 示例如下 GFF 全称 GenericFeatu 描述了基因组上各种特征的区间信息 包括染色体 基因 转录本等 GFF 文件本质上是一个 t 分隔的 共 9 列的纯文本文件

鉴于代码的排版问题,建议在电脑上阅读本文。

组装得到基因组的序列只是开展基因组研究的第一步,基因的结构是基因组后续功能研究的基石。在NCBI中,除了提供基因组序列外,还提供了基因结构的信息,采用的就是GFF格式。human示例如下

gff文件_GFF文件格式简介

GFF全称Generic Feature Format, 描述了基因组上各种特征的区间信息,包括染色体,基因,转录本等。GFF文件本质上是一个\t分隔的,共9列的纯文本文件。

1. column1

第一列是seqid, 代表序列ID, 通常是染色体的ID, 每条染色体拥有一个唯一的ID。

2. column2

第二列是source, 代表基因结构的来源,可以是数据库的名称,比如来自genebank数据库,也可以是软件的名称,比如用GeneScan软件预测得到,当然,也可以为空,用.点号填充。

3. column3

第三列是type, 代表区间对应的特征类型,比如gene, exon等。

4. column4

第四列是start, 代表区间的起始位置。

5. column5

第四列是end, 代表区间的终止位置。

6. column6

第六列是score, 软件提供了统计值,如果没有,就用.填充。

7. column7

第七列是strand, 代表正负链的信息, +表示正链,-表示负链,?表示不清楚正负链的信息,当正负链信息没有意义时,可以用.填充。

8. column8

第八列

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/199184.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月26日 下午1:39
下一篇 2026年3月26日 下午1:39


相关推荐

  • 解决win10状态栏的搜索框无法搜索本地应用或无反应

    解决win10状态栏的搜索框无法搜索本地应用或无反应今天突然出现的问题,在状态栏左下角的搜索框搜索OneNote没有任何反应,对,就是这个地方。最后在另一篇博客上找到了答案,那篇博客也是在知乎找到的答案,虽然是用被人的方法解决了问题,但我还是打算记下来;1、首先,打开管理员命令窗口,win+x,可以看到弹出一个窗口,打开windowsPowershell(管理员)如图2,输入下面这行英文startpowershell然…

    2022年6月4日
    46
  • eclipse导入maven工程报错的解决「建议收藏」

    eclipse导入maven工程报错的解决「建议收藏」svn检出代码报错解决

    2022年5月31日
    100
  • Deep Link

    Deep LinkDeepLink是什么DeepLink,又叫deeplinking,中文翻译作深层链接。全家桶搜索的话你会发现第一个结果是AppLink。呵呵。说回正题。简单地从用户体验来讲,DeepLink,就是可以让你在手机的浏览器/GoogleSearch上点击搜索的结果,便能直接跳转到已安装的应用中的某一个页面的技术。如果你想体验的话,可以在Android4.1以上设备安装IMDB,然后在Go…

    2022年6月18日
    77
  • idea怎么查看maven版本_idea中maven

    idea怎么查看maven版本_idea中mavenidea查看maven版本idea查看maven版本

    2022年8月22日
    15
  • logistic回归分析优点_二元Logistic回归

    logistic回归分析优点_二元Logistic回归点击上方蓝字关注我们在社会科学的研究中 经常会遇到二元变量的情况 例如死亡或未死亡 购买或未购买等 对于二元变量 无法直接采用一般的多元线性模型无法进行回归分析 因为残差不满足正态性 无偏性 共方差性等假设 同时解释变量的取值范围不再是 如果希望根据一系列预测变量的值来预测某种特征或结果是否存在 且因变量为二元变量 通常采用二元 Logistic 回归 1 二元逻辑回归分析的原理与

    2026年3月18日
    1
  • C++ CString转int int转CString「建议收藏」

    1.CString转int    CStringstrtemp="100";  int intResult;  intResult=atoi(strtemp);  —————————————————————–   2int转CString     CStringstr…

    2022年4月6日
    244

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号