- 数据预处理(DNA genotyping、Quality control、Imputation)

2. 表型数据统计分析
-
-
- 表型数据正态分析(如果不是正态分布,需转换处理为正态分布)
- 表型数据均值、中值、最大值、最小值
- 影响因子对表型的影响分析
线性回归(表型数据为连续性变量)
逻辑回归(表型数据为二元)
-
3.画曼哈顿图(GWAS)和 plot图
-
- (1)、准备PED文件

- (2)、准备MAP文件

- (3)、生成bed、fam、bim、文件
在plink中输入命令:plink –file mydata –out mydata –make-bedplink指的是plink软件,如果软件安装在某个指定的路径的话,前面还要加上路径,比如安装在路径为/your/pathway/的文件夹下,则命令应该为“/your/pathway/plink –file mydata –out mydata –make-bed”mydata指的是1和2生成的PED和MAP文件名,不需要写.ped和.map后缀 - (二)、准备表型文件(Alternate phenotype files)

- (三)、准备协变量文件(Covariate files)

- (四)、plink进行表型和基因型以及协变量的关联分析

- (五)、画曼哈顿图(GWAS)图

- (六)、画 plot图

(一)、准备plink文件
4. GWAS进阶分析
-
- 不同群体重复验证分析,Replication

- Regional association plots

用LocusZoom(http://csg.sph.umich.edu/locuszoom/)画出来的 - 相似条件分析,Approximate conditional analysis

- 连锁不平衡得分评估表型间遗传相关性,Linkage-disequilibrium score regression

- 基因富集分析,Gene setenrichment analysis

- 层次聚类分析,Hierarchicalclustering

- 蛋白质-蛋白质互作网络分析,Protein–proteininteraction network analyses

- Point ofcontact analyses

群体分层分析,Population Stratification
-
参考文献: Horikoshi, Momoko, et al. “Genome-wide associations for birth weight and correlations with adult disease.” Nature 538.7624 (2016): 248. Okbay A, Beauchamp J P, Fontana M A, et al. Genome-wide association study identifies 74 loci associated with educational attainment[J]. Nature, 2016, 533(7604): 539.
转载于:https://www.cnblogs.com/chenwenyan/p/10129785.html
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/204519.html原文链接:https://javaforall.net
