群体结构分析软件admixture安装及使用经验

群体结构分析软件admixture安装及使用经验1.软件下载及安装admixture:使用conda进行软件安装condainstalladmixture2.VCF文件格式转换为bed格式文件(似乎admixture可以直接识别ped/map文件格式的输入文件)vcf文件转为ped文件:方法1:使用vcftools支持将vcf文件转换成plink对应的ped/map格式,如下vcftools–vcfinput.vcf–plink–outoutput方法2:plink支持直接读取vcf文件..

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

1. 软件下载及安装admixture:

使用conda进行软件安装

conda install admixture

Jetbrains全家桶1年46,售后保障稳定

2. VCF文件格式转换为bed格式文件(似乎admixture 可以直接识别ped/map文件格式的输入文件)

vcf文件转为ped文件:

方法1:

使用vcftools支持将vcf文件转换成plink对应的ped/map格式,如下

vcftools  --vcf input.vcf --plink --out output

方法2:

plink支持直接读取vcf文件格式,基本用法如下:

plink --vcf input.vcf --recode --out output 

 

群体结构分析软件admixture安装及使用经验

map文件      染色体编号为数字, 未知为0SNP名称为字符或数字, 如果不重要, 可以从1编号, 注意要和bed文件SNP列一一对应染色体的摩尔未知(可选项, 可以用0)SNP物理坐标

重要! 因为转换成的ped和map文件无法匹配,需要手动更改上一步转换好的map文件

map数据格式为四列

 

群体结构分析软件admixture安装及使用经验

bed文件    第一列: Family ID # 如果没有, 可以用个体ID代替第二列: Individual ID # 个体ID编号第三列: Paternal ID # 父本编号第四列: Maternal ID # 母本编号第五列: Sex (1=male; 2=female; other=unknown) # 性别, 如果未知, 用0表示第六列: Phenotype # 表型数据, 如果未知, 用0表示第七列以后: 为SNP分型数据, 可以是AT CG或11 12, 或者A T C G或1 1 2 2————————————————版权声明:本文为CSDN博主「育种数据分析之放飞自我」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/yijiaobani/article/details/83017730

使用plink将ped/map转换为二进制的bed文件,命令行如下:

plink --file inputfile --make-bed --out filename

第一个FILENAME的后缀为.ped和.map,生成的第二个FILENAME的后缀为.bed、.bim、.fam

 

3. plink提取指定样本和指定SNP的数据(keep,extract函数

plink --bfile inputfile --noweb --keep sampleID.txt --recode --make-bed --out fileout

inputfile为不加.bed后缀的bed文件

其中,sampleID.txt第一列为提取的样本Family ID,第二列为Within-family ID(IID)

plink提取SNP位点:

plink --bfile file --extract snp.txt --make-bed --out snp

其中,snp.txt的文件格式如下,一个SNP位点一行:

rs1

rs2

rs3

群体结构分析软件admixture安装及使用经验

4. 如何选择合适的K值

可以同时运行多个程序, 每个程序不同的k值, 比如, 想要k值选择1,2,3,4,5, 可以写为:

 for K in 1 2 3 4 5; do admixture --cv hapmap3.bed $K | tee log${K}.out; done

例子:

for K in 1 2 3 4 5 6 7 8 9 10 11 12; do admixture –cv 10729bed2.bed $K | tee log${K}.out; done

多线程: admixture  hapmap3.bed 3 -j 4

使用grep命令去查看*out文件的cv error(交叉验证的误差)值:

grep -h CV  *.out

结果如下:(这个K值显示是否有误?应该从第一开始分别是K=1,2,3依次往下)

群体结构分析软件admixture安装及使用经验

群体结构分析软件admixture安装及使用经验

对这个K值出现这样的情况?为何K10开始,个人觉得这个K值显示有误,应该从第一开始分别是K=1,2,3依次往下

5. 绘制Q值的百分比柱状图

使用R语言

ta1 = read.table("D:/files.3.Q")

head(ta1)

barplot(t(as.matrix(ta1)),col = rainbow(3),

        xlab = "Individual",

        ylab = "Ancestry",

        border = NA)

 

————————————————————————————————————————————

本文部分分析步骤参考了CSDN博主「育种数据分析之放飞自我」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 

原文链接:https://blog.csdn.net/yijiaobani/article/details/83017730

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/206762.html原文链接:https://javaforall.net

(0)
上一篇 2025年8月4日 下午11:43
下一篇 2025年8月5日 上午7:22


相关推荐

  • 单片机原理及应用复习「建议收藏」

    单片机原理及应用复习「建议收藏」单片机总复习1.什么是单片机?特点?将通用微型计算机基本功能部件集成在一块芯片上构成的一种专用微计算机系统(嵌入式系统),用于解决小型被控对象的智能化问题(SCM或MCU)。特点:体积小(便于嵌入到小型被控对象中);扩展性好(便于组成各种应用系统);可靠性高(集成后外部连线减少,抗干扰能力增强);价格低廉(便于普及应用)2.单片机的发展趋势3.进制之间的转换搞明白点注意下有符号数还是…

    2025年9月21日
    8
  • sftp介绍

    sftp介绍sftp 是 SecureFileTr 的缩写 安全文件传送协议 可以为传输文件提供一种安全的加密方法 sftp 与 ftp 有着几乎一样的语法和功能 SFTP 为 SSH 的一部分 是一种传输档案至 Blogger 伺服器的安全方式 其实在 SSH 软件包中已经包含了一个叫作 SFTP SecureFileTr 的安全文件传输子系统 SFTP 本身没有单独的守护进程 它必须使用 sshd 守护进程 端口号默认是 22 来完成相应的连接操作 所以从某种意义上来说 SFTP 并不像

    2026年3月26日
    1
  • Python运行环境详细总结

    Python运行环境详细总结1 Python 运行环境概述 2 JupyterNoteb 1 安装 2 2 基本操作 2 3 基本单元 cell2 3 1 命令模式的快捷键 2 3 2 编辑模式下的两种命令 2 4 黑科技操作 3 安装 升级和删除库 3 1pip3 2conda

    2026年3月26日
    2
  • java json转xml 工具类_xml与json

    java json转xml 工具类_xml与jsonhttps://mvnrepository.com/artifact/net.sf.json-lib/json-lib/2.4目前最新的是2.4的版本,json-lib还需要以下依赖包:通过mvn库可以直接去下载。jakartacommons-lang2.5jakartacommons-beanutils1.8.0jakartacom

    2025年10月1日
    4
  • docker部署jenkins安装使用教程_免费docker容器

    docker部署jenkins安装使用教程_免费docker容器前言使用docker安装jenkins环境,jenkins构建的workspace目录默认是在容器里面构建的,如果我们想执行python3的代码,需进容器内部安装python3的环境。进jenki

    2022年7月31日
    8
  • finalize作用

    finalize作用转自 https blog csdn net a article details finalize 是 Object 中的方法 当垃圾回收器将要回收对象所占内存之前被调用 即当一个对象被虚拟机宣告死亡时会先调用它 finalize 方法 让此对象处理它生前的最后事情 这个对象可以趁这个时机挣脱死亡的命运 要明白这个问题 先看一下虚拟机是如何判断一个对象该死的 判定死亡 GCROOTS 定义 GC 管理的主要区域是 Java 堆 一般情况下只针对堆进行垃圾回收

    2026年3月19日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号