python中merge函数「建议收藏」

python中merge函数「建议收藏」merge函数用来合并下面我们看看长什么样子merge(left,right,how=’inner’,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=False,suffixes=(‘_x’,’_y’),copy=True,indicator=False,valida…

大家好,又见面了,我是你们的朋友全栈君。

merge函数用来合并
下面我们看看长什么样子

merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

left,right就是要连接的两个dataframe。
how就是连接的方法
inner:内连接,即主标签相同的就留下

>>> a=pd.DataFrame({'key':['a','b','c'],'val1':range(3)})
>>> b=pd.DataFrame({'key':['a','d','a'],'val1':range(3)})
a
  key  val1
0   a     0
1   b     1
2   c     2
 b
  key  val1
0   a     0
1   d     1
2   a     2

 pd.merge(a,b)
key  val1  val2
0   a     0     0
1   a     0     2

全连接:即把a,b集放在一起,没有的就是NaN

pd.merge(a,b,how='outer')         
  key  val1  val2
0   a     0   0.0
1   a     0   2.0
2   b     1   NaN
3   c     2   NaN            

左连接,左边取全部,右边取部分

pd.merge(a,b,how='left')
  key  val1  val2
0   a     0   0.0
1   a     0   2.0
2   b     1   NaN
3   c     2   NaN

右连接,右边取全部,左边取部分

pd.merge(a,b,how='right')
  key  val1  val2
0   a   0.0     0
1   a   0.0     2
2   d   NaN     1

left_on,和right_on主要就是键名不同的话,就指定连接的键名,我就不细说了.可以看看这个博客https://blog.csdn.net/qq_21840201/article/details/80727504

on的话就是主键:比如两个相同标签你指定一个作为主键,详细的话可以看看这个
https://blog.csdn.net/casey_cai/article/details/56834649

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137647.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 【20211009】【数学基础】极值点、驻点、拐点的区别和联系

    【20211009】【数学基础】极值点、驻点、拐点的区别和联系一 极值点 1 定义极大值和极小值统称为极值点 极值点是函数的某段子区间内极大值或者极小值的横坐标 极值点出现在函数的驻点 导数为 0 或不可导点处 导函数不存在 参考 极值点 驻点 拐点的区别 2 判别方法 1 若 f x0 处可导第一判别法 若 f x0 处的一阶导数 且 x0 左边的区间内导数 gt 0 x0 右边的区间内导数 lt 0 那么 x0 为极大值 第

    2025年10月8日
    4
  • 程序书写规范笔记

    程序书写规范笔记

    2021年8月19日
    57
  • HDU 5952 Counting Cliques -暴力

    HDU 5952 Counting Cliques -暴力

    2022年3月2日
    36
  • 集成学习-stacking算法

    众所周知,集成学习算法,它将多个弱分类器集成起来,以达到较高的分类准确率。常见的集成学习方法:boosting bagging stacking今天主要讲stacking.Stacking的基本思想将个体学习器结合在一起的时候使用的方法叫做结合策略。对于分类问题,我们可以使用投票法来选择输出最多的类。对于回归问题,我们可以将分类器输出的结果求平均值。…

    2022年4月16日
    67
  • 舆情监测分析系统_舆情监测系统

    舆情监测分析系统_舆情监测系统一、引言1.1目的  编写此文档的目的是确认舆情分析系统的需求及系统边界,指导系统的设计。1.2项目信息项目名称:舆情分析系统项目提出者:指导教师开发者:东北大学软件学院大数据班T09实训项目组(lzf、lcx)用户:舆情分析员、系统管理员1.3缩写说明1.4术语定义1.5参考资料新浪舆情通:https://yqt.mdata.net/二、舆情分析系统概述2.1舆情分析系统介绍  我们的舆情分析系统主要包括舆情总缆分析、舆情搜索、文章分析、文章评论分析、事件

    2025年11月21日
    2
  • 【面试题】-java分布式及微服务面试题汇总

    【面试题】-java分布式及微服务面试题汇总目录1.CAP理论2.BASE理论3.接口的幂等性问题4.消息中间件如何解决消息丢失问题5.什么是分布式事务?分布式事务的类型有哪些?6.分布式事务的解决方案有哪些?7.Dubbo的服务请求失败怎么处理10.Soa和微服务架构有哪些区别?11.dubbo服务提供者,服务消费者需要配置哪些信息?12.Dubbo有哪些负载均衡策略13.Redis的持久化方式…

    2022年6月12日
    40

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号