merge函数_merge函数

merge函数_merge函数R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。merge(x,y,by=intersect(names(x),names(y)),by.x=by,by.y=by,all=FALSE,all.x=all,all.y=all,sort=TRUE,suffixes=c(“.x”,”.y”),inco…

大家好,又见面了,我是你们的朋友全栈君。

R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。

merge(x, y, by = intersect(names(x), names(y)), by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all, sort = TRUE, suffixes = c(“.x”,”.y”), incomparables = NULL, …)

x,y:用于合并的两个数据框

by,by.x,by.y:用于连接两个数据集的列,intersect(a,b)值向量a,b的交集,names(x)指提取数据集x的列名 by = intersect(names(x), names(y)) 是获取数据集x,y的列名后,提取其公共列名,作为两个数据集的连接列, 当有多个公共列时,需用下标指出公共列,如names(x)[1],指定x数据集的第1列作为公共列 也可以直接写为 by = ‘公共列名’ ,前提是两个数据集中都有该列名,并且大小写完全一致,R语言区分大小写

all,all.x,all.y:指定x和y的行是否应该全在输出文件.

sort:by指定的列是否要排序.

suffixes:指定除by外相同列名的后缀.

incomparables:指定by中哪些单元不进行合并.

merge函数有4种匹配拼接模式,分别为inner,left,right和outer模式。 其中inner为默认的匹配模式。all=T代表全连接,all.x=T代表左联结;all.y=T代表右连接

inner 模式匹配,只显示两个数据集公共列中均有的行

有多个公共列时,需指出使用哪一列作为连接列merge(x,y,by=intersect(names(x)[1],names(y)[1]))

当两个数据集连接列名称同时,直接用by.x,by.y 指定连接列merge(x,y,by.x =’name’,by.y =’name’)

当两个数据集均有连接列时,直接指定连接列的名称merge(x,y,by=’name’)

outer 模式,将两张表的数据汇总,表中原来没有的数据置为空

merge(x, y, all=TRUE, sort=TRUE)

all = TRUE 表示选取x, y 数据集的所有行,sort = TRUE,表示按 by 列进行排序,默认升序

left 匹配模式

merge(x ,y,all.x=TRUE,sort=TRUE)

多个公共列 末指定连接列 ,左连接,设置 all.x = TRUE,结果只显示数据x的列及x在y数据集中没有的列

merge(x, y, by = ‘name’,all.x = TRUE, sort = TRUE) # 多个公共列 指定连接列指, 左连接,设置 all.x = TRUE,结果只显示x所有names(x)[1]值

right 匹配模式

merge(x ,y ,by=’name’,all.y=TRUE,sort=TRUE)

多个公共列指定连接列# 左连接,设置all.y =TRUE,结果只显示y所有names(y) [1] 值的记录

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131147.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月12日 下午8:36
下一篇 2022年6月12日 下午8:36


相关推荐

  • 2021美赛B题解题思路(Fighting Wildfires)

    2021美赛B题解题思路(Fighting Wildfires)准时赴约 等待开题中

    2026年3月19日
    2
  • 普通人用AI提效?即梦和可灵实测对比,这篇帮你避坑

    普通人用AI提效?即梦和可灵实测对比,这篇帮你避坑

    2026年3月12日
    2
  • ads1115与树莓派

    ads1115与树莓派RaspberryPi 读取模拟信号急需求解 使用 RaspberryPi 读取输出模拟信号由于 RaspberryPi3 内部没有集成 ADC 因此需要外接 ADC 来进行模数转换 外接 ADC 选用的是 ADS1115 I2C 的通讯方式实现起来相对容易些 简单介绍一下 ADS 模拟 数字转换器特点 1 超小型 QFN 封装 2mm1 5mm0 4mm2 宽电源电压范围 2 0V 5

    2026年3月19日
    2
  • 软件测试的基本理论知识_软件测试基础知识整理

    软件测试的基本理论知识_软件测试基础知识整理01软件研发流程1.软件产品软件产品是指向用户提供的计算机软件、信息系统或设备中嵌入的软件或在提供计算机信息系统集成、应用服务等技术服务时提供的计算机软件。2.软件工程软件工程,英文名SoftwareEngineering,是一门研究用工程化方法构建和维护有效的、实用的和高质量的软件的学科。“软件工程是开发、运行、维护和修复软件的系统方法。”这个定义相当概括,它主要强调软件工程是系统方法而不是某种…

    2025年7月30日
    5
  • django urls_关于URL的作用

    django urls_关于URL的作用前言为什么我们url需要命名呢?url命名的作用是什么?我们先来看一个案例案例我们先在一个Django项目中,创建2个App,前台front和后台cms,然后在各自app下创建urls.py文件

    2022年7月28日
    7
  • Java中DAO层、Service层和Controller层的区别

    Java中DAO层、Service层和Controller层的区别DAO 层 DAO 层叫数据访问层 全称为 dataaccessob 属于一种比较底层 比较基础的操作 具体到对于某个表的增删改查 也就是说某个 DAO 一定是和数据库的某一张表一一对应的 其中封装了增删改查基本操作 建议 DAO 只做原子操作 增删改查 Service 层 Service 层叫服务层 被称为服务 粗略的理解就是对一个或多个 DAO 进行的再次封装 封装成一个服务 所以这里也就不

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号