高通量测序中的reads、contig、scaffold

高通量测序中的reads、contig、scaffold高通量测序 reads contig scaffold

1.什么是read?

高通量测序时,在芯片上的每个反应,会读出一条序列,是比较短的,叫read,它们是读序;就是我们测序产生的短读序列,通常一代和三代的reads读长在几千到几万bp之间,二代的相对较短,平均是几十到几百bp。PE reads 就是 paired-end reads。在测序过程中,一条DNA分子的两端都可以测序。先测其中的一端,获得一个reads,然后再转到另一端测序,获得另外一个reads。得到的这两个reads就是PE reads。PE reads 的获得有助于后期序列组装。

2.什么是contig?

有很多reads通过片段重叠,能够组装成一个更大的片段,称为contig,它们是(片段)重叠群;就是不同reads之间的overlap(交叠区),拼接成的序列就是contig。

Contig N50:Reads拼接后会获得一些不同长度的Contigs.将所有的Contig长度相加,能获得一个Contig总长度.然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,contig 3…………Contig 25.将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50.举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig总长度*1/2时,Contig 4的长度即为Contig N50.ContigN50可以作为基因组拼接的结果好坏的一个判断标准。

3.什么是scaffold?

多个contigs通过片段重叠,组成一个更长的scaffold,中文中有脚手架的含义;是比contig还要长的序列,获得contig之后还需要构建paired-end或者mate-pair库,从而获得一定片段的两端序列,这些序列可以确定contig的顺序关系和位置关系,最后contig按照一定顺序和方向组成scaffold,其中形成scaffold过程中还需要填补contig之间的空缺。基因组de novo测序,通过reads拼接获得Contigs后,往往还需要构建454 Paired-end库或Illumina Mate-pair库,以获得一定大小片段(如3Kb、6Kb、10Kb、20Kb)两端的序列。基于这些序列,可以确定一些Contig之间的顺序关系,这些先后顺序已知的Contigs组成Scaffold。

Scaffold N50:Scaffold N50与Contig N50的定义类似.Contigs拼接组装获得一些不同长度的Scaffolds.将所有的Scaffold长度相加,能获得一个Scaffold总长度.然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3…………Scaffold 25.将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50.举例:Scaffold 1+Scaffold 2+ Scaffold3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2时,Scaffold 5的长度即为Scaffold N50.Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准.

一个contig被组成出来之后,鉴定发现它是编码蛋白质的基因,就叫singleton

多个contigs组装成scaffold之后,鉴定发现它编码蛋白质的基因,叫unigene。

高通量测序中的reads、contig、scaffold

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/229149.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午5:21
下一篇 2026年3月16日 下午5:22


相关推荐

  • 文件夹提示文件或目录损坏且无法读取

    文件夹提示文件或目录损坏且无法读取文件夹无法访问文件名变乱码的恢复方法硬盘损坏怎么恢复 硬盘是我们工作 学习和生活中常用的信息存储工具 因为容量大 价格便宜而深受人们的喜爱 因此硬盘也成为了我们一些重要信息的信息载具 文件夹提示 文件或目录损坏且无法读取 的恢复方法这时我们该如何恢复我们丢失的文件呢 这个时候一定要记住不要再进行读写操作 以防数据被覆盖永久丢失 并且第一时间运用专业软件恢复 因为数据丢失时间越短找回的可能性越大 文件夹提示文件或目录损坏且无法读取工具 软件 AornData 软件步骤 1 先

    2026年3月16日
    3
  • nodejs安装后没有npm(nodejs和npm)

    如下命令便可以实现该目的:#apt-get卸载sudoapt-getremove–purgenpmsudoapt-getremove–purgenodejssudoapt-getremove–purgenodejs-legacysudoapt-getautoremove#手动删除n…

    2022年4月10日
    882
  • Windows2016 NLB操作模式

    Windows2016 NLB操作模式Windows2016N 操作模式 WIndowsNLB 的操作模式分为单播模式与组播模式单播模式在该模式下 NLB 集群内的所有服务器的 MAC 都会被替换成一个集群 MAC 地址 他们通过此群集 MAC 地址来接收外部来的连接 WebFr

    2026年3月17日
    2
  • HTTP header location 重定向 URL

    HTTP header location 重定向 URLhttp头信息头信息的作用很多,最主要的有下面几个:1、跳转当浏览器接受到头信息中的Location:xxxx后,就会自动跳转到xxxx指向的URL地址,这点有点类似用js写跳转。但是

    2022年7月2日
    33
  • git放弃修改&放弃增加文件

    git放弃修改&放弃增加文件

    2022年2月10日
    59
  • ByteBuffer的用法[通俗易懂]

    ByteBuffer的用法[通俗易懂]ByteBuffer也许很多人不常用,其实它是最常用的缓冲区,可以负责缓冲存储一段数据,供数据的写入和读取。ByteBuffer是NIO里用得最多的Buffer。ByteBuffer最核心的方法是put(byte)和get()。分别是往ByteBuffer里写一个字节,和读一个字节。值得注意的是,ByteBuffer的读写模式是分开的,正常的应用场景是:往ByteBuffer里写一些数

    2022年10月2日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号