FastQC_fastech

FastQC_fastech1、下载fastqc2、解压3、给予执行权限,否则执行的时候会显示没有权限cdFastQCchmod755fastqc4、加入到PATHexportPATH=/home/h/Fas

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

1、下载fastqc

wget 
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.5.zip

2、解压

unzip fastqc_v0.11.5.zip

 
3、 给予执行权限,否则执行的时候会显示没有权限

cd FastQC

chmod 755 fastqc

 
4、加入到PATH

export PATH=/home/h/FastQC/:$PATH

 
5、测试

fastqc –help

使用例子
# -o –outdir FastQC生成的报告文件的储存路径,生成的报告的文件名是根据输入来定的
# -t –threads 选择程序运行的线程数,每个线程会占用250MB内存,越多越快咯
 
 
FastQC的报告介绍
整个报告分成若干个部分。合格会有个绿色的对勾,警告是个“!”,不合格是个红色的叉子
 
基本信息
FastQC_fastech
# Encoding指测序平台的版本和相应的编码版本号,这个在计算Phred反推error P的时候有用
# Total Sequences记录了输入文本的reads的数量
# Sequence length是测序的长度
# %GC是我们需要重点关注的一个指标,这个值表示的是整体序列中的GC含量,这个数值一般是物种特异的,比如人类细胞就是42%左右
 
序列测序质量统计
FastQC_fastech
# 此图中的横轴是测序序列第1个碱基到第101个碱基
# 纵轴是质量得分,Q = -10*log10(error P)即20表示1%的错误率,30表示0.1%
# 图中每1个boxplot,都是该位置的所有序列的测序质量的一个统计,上面的bar是90%分位数,下面的bar是10%分位数,箱子的中间的横线是50%分位数,箱子的上边是75%分位数,下边是25%分位数
# 图中蓝色的细线是各个位置的平均值的连线
# 一般要求此图中,所有位置的10%分位数大于20,也就是我们常说的Q20过滤
# 所以上面的这个测序结果,需要把后面的87bp以后的序列切除,从而保证后续分析的正确性
# Warning 报警 如果任何碱基质量低于10,或者是任何中位数低于25
# Failure 报错 如果任何碱基质量低于5,或者是任何中位数低于20
 
每个tail测序的情况
FastQC_fastech
# 横轴和之前一样,代表101个碱基的每个不同位置
# 纵轴是tail的Index编号
# 这个图主要是为了防止在测序过程中,某些tail受到不可控因素的影响而出现测序质量偏低
# 蓝色代表测序质量很高,暖色代表测序质量不高,如果某些tail出现暖色,可以在后续分析中把该tail测序的结果全部都去除
 
每条序列的测序质量统计
FastQC_fastech
# 假如我测的1条序列长度为101bp,那么这101个位置每个位置Q值的平均值就是这条reads的质量值
# 该图横轴是0-40,表示Q值
# 纵轴是每个值对应的reads数目
# 我们的数据中,测序结果主要集中在高分中,证明测序质量良好!
 
GC 含量统计
FastQC_fastech
# 横轴是1 – 101 bp;纵轴是百分比
# 图中四条线代表A T C G在每个位置平均含量
# 理论上来说,A和T应该相等,G和C应该相等,但是一般测序的时候,刚开始测序仪状态不稳定,很可能出现上图的情况。像这种情况,即使测序的得分很高,也需要cut开始部分的序列信息,一般像我碰到这种情况,会cut前面5bp
 
序列平均GC含量分布图
FastQC_fastech
# 横轴是0 – 100%; 纵轴是每条序列GC含量对应的数量
# 蓝色的线是程序根据经验分布给出的理论值,红色是真实值,两个应该比较接近才比较好
# 当红色的线出现双峰,基本肯定是混入了其他物种的DNA序列
# 这张图中的信息良好
 
序列测序长度统计
FastQC_fastech
# 每次测序仪测出来的长度在理论上应该是完全相等的,但是总会有一些偏差
# 比如此图中,101bp是主要的,但是还是有少量的100和102bp的长度,不过数量比较少,不影响后续分析
# 当测序的长度不同时,如果很严重,则表明测序仪在此次测序过程中产生的数据不可信 
 
序列Adapter
FastQC_fastech
# 此图衡量的是序列中两端adapter的情况
# 如果在当时fastqc分析的时候-a选项没有内容,则默认使用图例中的四种通用adapter序列进行统计
# 本例中adapter都已经去除,如果有adapter序列没有去除干净的情况,在后续分析的时候需要先使用cutadapt软件进行去接头
 
重复短序列
FastQC_fastech
# 这个图统计的是,在序列中某些特征的短序列重复出现的次数
# 我们可以看到1-8bp的时候图例中的几种短序列都出现了非常多的次数,一般来说,出现这种情况,要么是adapter没有去除干净,而又没有使用-a参数;要么就是序列本身可能重复度比较高,如建库PCR的时候出现了bias
# 对于这种情况,我的办法是可以cut掉前面的一些长度,可以试着cut 5~8bp
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167116.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • matlab函数plot函数_动态变量

    matlab函数plot函数_动态变量引子对于真实系统或者仿真平台,数据是增量式的产生的。Matlab除了强大的矩阵运算外,还具有强大的数据可视化库。由于静态画图的方法较多,本文只针对增量式数据流的动态显示。本文主要介绍几种Matlab实现数据的动态显示方法。方法主要有两种:holdonset函数与drawnow函数组合holdon方法1.方法介绍此种方法比较原始,适合于即时数据,原理是先画上一帧,接着保留原始图像,

    2022年10月10日
    2
  • JSP简明教程「建议收藏」

    1、jsp是什么?1)jsp:javaserverpages2)jsp运行在服务器3)jsp的基础是servlet,相当于对servlet进行一个包装4)jsp无需配置,直接使用,如果修改了jsp文件,不需要重新reloadweb应用5)jsp访问方法:http://ip:8080/web应用名/jsp路径6)jsp是一种动态网页技术2、JSP=html+java片段+JSP标签(语法)+j

    2022年4月16日
    53
  • 图形推理1000题pdf_2019和平区一模24题解析

    图形推理1000题pdf_2019和平区一模24题解析2019和平区数学一模24题解析推理与论证是在探索图形性质、与他人合作交流等活动过程中,发展合情推理,进一步学习有条理的思考与表达;数学推理的内涵是从数和形的角度进行合情推理和演绎推理,是对归纳类比的发展,判断和证明的过程。和平区数学一模试卷24题第(1)问在正方形中利用全等证明线段相等,考察几何问题的推理论证,推理探究。思考的角度不同,方法各异,但殊途同归,考察学生的逻辑推理论证,书写…

    2025年10月16日
    2
  • navicat生成激活码错误【2021.7最新】

    (navicat生成激活码错误)本文适用于JetBrains家族所有ide,包括IntelliJidea,phpstorm,webstorm,pycharm,datagrip等。https://javaforall.net/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~M…

    2022年3月21日
    186
  • Spring+Struts+Hibernate 简介(转)

    Spring+Struts+Hibernate 简介(转)

    2021年9月10日
    66
  • servu搭建ftp服务器教程_ftp端口映射

    servu搭建ftp服务器教程_ftp端口映射映口映射的功能主要就是实际互联网可以访问当前进行映射的电脑,首先我们要进行路由器的端口映射,常见的开放端口有80,21,3389等,80是网站常用端口,21是FTP服务器常用端口,3389是远程桌面连接端口。下面为大家详细讲解端口映射的具体方法!1,首先我们要了解路由器的配置介面的IP地址,常用的是192.168.0.1或192.168.1.1,假如你不知道自己的路由器的配置页面的IP

    2025年10月29日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号